【コラム】競馬予想にみるビックデータの活用

今年も数える程になり一年を振り返って自分なりの成績をつけてみたりしています。
成績と言えば今年最後の重賞(G1)レース有馬記念で圧倒的な強さを見せて優勝、そしてこのレースを最後に引退した3冠馬のオルフェーヴル。
2年連続で凱旋門賞に参戦し連続2着。競馬史に残る輝かしい成績を残しての引退です。

このレースを見ていて、競馬の世界でのビックデータがどのように活用されているか興味が湧いてきたので調べてみました。
現在、中央競馬は10の競馬場で年間で最大288日行われるれます。その主催者がJRAと言われる日本中央競馬会です。

・JRAの凄いシステム

数多くの勝馬投票券(馬券)を窓口、電話、インターネットで発券し、払い戻しも確定後数分で行うとなるとさぞ凄いシステムが構築されていることが想定出来ますが、このシステムは関連会社のJRAシステムサービス株式会社がJRA(日本中央競馬会)の委託を受けて運用してます。
この会社のホームページを見てみると業務内容には「大手金融機関の勘定系に匹敵する国内トップクラスの大規模高信頼性ネットワーク・システムを運用しています。」と書いてあるくらいですからかなり凄いのでしょう。
http://jra-van.jp/nx/index.html

JRA-VAN

・JRAのビックデータ/データマイニング

JRAでは顧客に対してインターネットで「JRAーVAN NEXT」と言うレースに関する情報サービスを提供しており、中でも、ビックデータ/データマイニングによる予測機能に注目してみます。

データマイニングとは?

データマイニングは、日々刻々と得られる競馬データの中から、人工知能技術を応用した統計理論に基づいて、隠れた規則性や因果関係を発見してレースを予測します。

JRA-VAN NEXTではJRA公式データから導く2つの予測モデルの結果を提供します。

1.タイム型データマイニング
(走破速度を予測するモデル)
タイム型データマイニングは、データマイニングや統計の処理上扱いやすい、走破速度を予測しています。

2.対戦型データマイニング
(競走馬の勝敗を予測するモデル)
対戦型データマイニングは、同じレースへ出走する競走馬の任意の2頭の勝ち負けを予測するモデルで、同レースに出走する競走馬が勝つ可能性をスコア(点数)化しています。
(JRA-VAN NEXT HPより抜粋)

それでは、オルフェーブルが優勝した先日の有馬記念(12/22日 中山競馬場10R)でその精度を見てみましょう。

オルフェーブル
圧倒的な強さを見せたオルフェーヴル

・タイム型データマイニングでの予想
有馬記念タイム型

データマイニングでの予想:1着 ゴールドシップ
人気:2番
実際の着順:3着

データマイニングでの予想:2着 オルフェーヴル
人気:1番
実際の着順:1着

・対戦型データマイニングでの予想有馬記念対戦型

データマイニングでの予想:1着 ウィンヴァリアシオン
人気:4番
実際の着順:2着

データマイニングでの予想:2着 オルフェーヴル
人気:1番
実際の着順:1着

このレースを見る限りかなり確立は高い!

しかし、翌日中山競馬場で行われたクリスマスカップ(12/23日 10R)では・・・・

・タイム型データマイニングでの予想
クリスマスカップタイム型

データマイニングでの予想:1着 リベルタス
人気:6番
実際の着順:14着

データマイニングでの予想:2着 ガチバトル
人気:8番
実際の着順:3着

・対戦型データマイニングでの予想
クリスマスカップ対戦型

データマイニングでの予想:1着 エーシングングン
人気:2番
実際の着順:6着

データマイニングでの予想:2着 クイーンオリーブ
人気:7番
実際の着順:5着

かすりもしない結果でした。

世の中では、気象予測、経済予測、株価予測など、さまざまな事象がモデル化されていますが、ビックデータを活用したデータマイニングであっても、競馬の場合、馬やジョッキーの体調、感情、レース展開などによって左右されてしまします。
将来、このような定量化出来ないものまでも指数化されていく可能性は有りますが、まだまだ未知数の部分を含んでいます。

ちなみに、オルフェーブルは一夜明けた23日福島県のノーザンファーム天栄で静かな朝を迎え、この日午前は常歩(なみあし)で体をほぐしたそうです。24日午後には、繋養(けいよう)先となる北海道の社台スタリオンステーションへと出発して行きました。

来年はどんな年になるのでしょうか?データと感性で未来予測をしてみてはいかがでしょう。

配信:O2O・オムニチャンネルコンサルティング フィルゲート 菊原政信