ニートの言葉

元ニートがやってみたこと・その過程で学んだこと・考えたこと・技術メモあたりを主に書いています。情報革命が起きた後に訪れるであろう「一億総ニート時代」の生き方を考え中です。

【競艇】過去20万件のデータを分析してわかった荒れるレースの条件

こんにちは、あんどう(@t_andou)です。

競艇の予想において、そのレースが「荒れるか」を見極めることは重要な要素の一つです。

巷では「風が強く波が高い日は荒れる」とか「江戸川は荒れやすい」など言われています*1が、本当なのでしょうか。
また、どんな要素が「荒れるレース」に影響するのでしょうか

今回はそれを検証してみたいと思います。

そもそも「荒れる」とは?

さて、「風が強く波が高い日は荒れやすい」などと書かれていたりしますが具体的な数字で「荒れ」が定義されていることはあまり見かけないです。

そこで、まずは「荒れる」の定義から始めます。

「荒れる」とは「皆の予想を裏切った結果」になること

「荒れる」とは皆の予想を裏切るような結果になること、つまり人気の低い組番が来ることだと言えます。

では、どのくらいの人気が来たら荒れたと言えるのでしょうか。 三連単の結果のデータを元に見てみましょう。

三連単・人気の出現分布

10番人気が中央値でした。
だいたい二回に一回は9番人気以内が来る割合ですね。

また、25番人気を境界線として見ると、3:1の割合になっていました。
つまり、25番人気以降が来る割合は4回に1回=25%くらい ということですね。

4回に一回の割合で起こるものだと「大荒れ」と言うほどではありませんが、今回はこの25番人気以降が来た場合を「荒れた」と定義することにします。

検証してみた

さて、前置きが長くなりましたが、それでは検証に移ります。*2
波や風速、会場がどの程度影響してくるのでしょうか。

検証する要素の一覧

今回は下記の要素別に検証してみます。

  • 会場別
  • 何日目のレースか
  • R別
  • 天気
  • 風速
  • 風向き
  • グレード
今回使ったデータ

今回は2015年1月1日から200,314レース分のデータで検証しました。

会場別

会場名 全件数 荒れた件数 荒れ率
桐生 8598件 2322件 27.01%
戸田 8268件 2604件 31.49%
江戸川 7837件 2322件 29.63%
平和島 8279件 2618件 31.62%
多摩川 8134件 2250件 27.66%
浜名湖 9105件 2428件 26.67%
蒲郡 8641件 2180件 25.23%
常滑 9179件 2251件 24.52%
8588件 2022件 23.54%
三国 8317件 1965件 23.63%
びわこ 8151件 2323件 28.5%
住之江 8351件 2049件 24.54%
尼崎 8171件 1792件 21.93%
鳴門 5253件 1573件 29.94%
丸亀 8972件 2412件 26.88%
児島 8414件 2027件 24.09%
宮島 8716件 2209件 25.34%
徳山 8559件 1591件 18.59%
下関 7888件 1805件 22.88%
若松 8766件 2138件 24.39%
芦屋 8668件 1951件 22.51%
福岡 8315件 2084件 25.06%
唐津 8623件 2036件 23.61%
大村 8521件 1565件 18.37%

これはかなり影響していますね。 大村では18%台なのに対し、平和島では31.5%を超えてくるなど、かなりの開きがあります。

天気

天気 全件数 荒れた件数 荒れ率
117110件 29649件 25.32%
曇り 61221件 15418件 25.18%
20480件 5059件 24.7%
985件 261件 26.5%
3件 0件 0.0%

雨の時に荒れそうかと思っていたのですが、天気はほとんど影響しないようですね。

波高 全件数 荒れた件数 荒れ率
0cm 17429件 4210件 24.16%
1cm 48154件 11301件 23.47%
2cm 43279件 11001件 25.42%
3cm 50345件 12723件 25.27%
4cm 14509件 3820件 26.33%
5cm 17088件 4674件 27.35%
6cm 3346件 897件 26.81%
7cm 2035件 591件 29.04%
8cm 1088件 309件 28.4%
9cm 314件 97件 30.89%
10cm 1914件 596件 31.14%

後半はサンプル数は少ないですが、じわじわと右肩上がりに見えます。
やはり波の高さが高くなると荒れてくるようです。

風速 全件数 荒れた件数 荒れ率
0m 12961件 3306件 25.51%
1m 35079件 8209件 23.4%
2m 46529件 11472件 24.66%
3m 45427件 11406件 25.11%
4m 29274件 7542件 25.76%
5m 16403件 4443件 27.09%
6m 7430件 2036件 27.4%
7m 3807件 1121件 29.45%
8m 2169件 628件 28.95%
9m 619件 172件 27.79%
10m 494件 148件 29.96%

こちらも後半はサンプル数が少ないのでなんとも言えないですが、少しずつ右肩上がりになっているような?
しかし、それほど影響は大きくないようにも見えます。

風向き

どれがどの向きなのかは調べてません。

風向き 全件数 荒れた件数 荒れ率
a 12962件 3307件 25.51%
b 12707件 3194件 25.14%
c 1748件 450件 25.74%
d 19267件 4778件 24.8%
e 4255件 1055件 24.79%
f 21948件 5647件 25.73%
g 6853件 1781件 25.99%
h 22221件 5241件 23.59%
i 2548件 652件 25.59%
j 16467件 3826件 23.23%
k 3397件 809件 23.82%
l 18566件 4594件 24.74%
m 2689件 633件 23.54%
n 29152件 7834件 26.87%
o 7344件 1869件 25.45%
p 17252件 4585件 26.58%
q 938件 262件 27.93%

風向きはあまり影響しないようです。

グレード

グレード 全件数 荒れた件数 荒れ率
一般 78714件 19043件 24.19%
G1 4375件 1266件 28.94%
女子 4373件 1054件 24.1%
G3 4084件 1195件 29.26%
G2 1152件 311件 27.0%
SG 936件 268件 28.63%

一般が荒れることは少ないようです。
女子もあまり荒れないみたいですね。

何日目

何日目 全件数 荒れた件数 荒れ率
1日目 36594件 9807件 26.8%
2日目 36568件 9402件 25.71%
3日目 36537件 9576件 26.21%
4日目 29936件 7191件 24.02%
5日目 23112件 5295件 22.91%
6日目 1017件 225件 22.12%
最終日 36537件 9019件 24.68%

後半になるほど荒れなくなっているように見えます。
*3

R別

何レース目 全件数 荒れた件数 荒れ率
1R 16723件 3807件 22.77%
2R 16713件 4992件 29.87%
3R 16709件 4985件 29.83%
4R 16709件 4700件 28.13%
5R 16706件 3966件 23.74%
6R 16698件 4275件 25.6%
7R 16693件 4029件 24.14%
8R 16684件 3943件 23.63%
9R 16677件 3952件 23.7%
10R 16675件 4284件 25.69%
11R 16667件 3956件 23.74%
12R 16660件 3628件 21.78%

これはちょっと面白い結果が出ました。
後半になるほど手堅い結果になるのは想像していましたが、1R目は荒れていないのに対し2~4R目が結構荒れてますね。

まとめ

会場・波・風速・R番号は影響している

今回は各条件において件数を出してみました。

その結果、

  • 戸田・平和島
  • 波が高い時
  • 風が強い時
  • 2~4R

は荒れやすいという傾向が見えました。 会場ごとに影響があるのは言われていたことですが、こうやって数字にするとハッキリと見えてくるものですね。

それにしても2~4Rが荒れやすいのは面白いと感じました。何が原因なのでしょう。

機械的に重要度を見てみた

今回は理解しやすいようにそれぞれを集計して具体的な数字にして出してみましたが、ミズハノメでも利用している技術を使えば、ある問題(今回でいうと荒れるかどうか)に対してどの要素がどのくらい重要なのかを機械的に出すことが出来ます。


(図:各要素の重要度)

文字が小さく見辛いですが、
1.どの会場か
2.何レース目か
が飛び抜けて重要なようです。

あとはそんなに重要度としては変わらないようでした。 波が高く・風が強い時は荒れるけれど、波高・風速という要素自体はそんなに影響しないということでしょうか。

最後に

今後もこういった分析を続けていきます。

「こういう視点で分析してほしい」と言ったご意見をお持ちの方は ミズハノメのTwitter(@mizuhanome2017)までご意見ください。

最後までご覧いただきありがとうございました。

*1:Google調べ

*2:データ分析に関しては素人ですので、良いやり方がありましたら教えていただけると幸いです。

*3:終日が何日目なのかは節によって違うので「最終日」というデータとして扱ってます。