(71)「血統データラボ」を見て

You Tubeで「競馬場の達人」を見ておりましたら、たまたま 2013年12月にグリーンチャンネルで放送しました「亀谷敬正の血統データラボ」を見つけました。
血統理論などは競馬評論家が知ったか振りをするための道具に過ぎないと思っていましたが、予想が結構的中しておりましたので競馬予想に利用できないかと思いました。
内容は一般的な血統による予想方法を更に細かくデータを分析して予想を行うものです。
番組は、JRA-VANの「データde出〜た」でやっているような、TARGET Frontier の宣伝目的ではないかと思って見ていたのですが、血統の分析に使っていただけで、嫌味を感じる程ではなかったですから、このソフトの宣伝目的(TARGET Frontier の回し者)ではないと思います。

競馬を予想する上で最も信頼できるのは、やはりオッズのようです。
単勝1番人気の馬が1着になる確率は最も高く、2番人気はその次、3番人気は2番人気の次になります。
この傾向は私が調べ始めた15年以上前から同じ傾向が続いておりますので、疑う余地がありません。
私はJRA-VANの予想ソフトの的中率を2005年頃から調べておりますが、重賞競走の場合を調べたのですが単勝1番人気を軸にして7番人気まで6点購入する方法が、他のどんな予想ソフトよりも的中率は毎年良いです。

つまりは、オッズの通りに買う方法が最も良く的中すると言う事です。
では、なぜこんなに優れた方法なのに誰も人気通りの馬券を買わないのでしょうか。
これも、競馬をやっている人なら分かりますよね。
その馬券の買い方では必ず損をするからです。
必ず損をすると言うのは、1年ぐらいのスパンで見た場合で、1日ぐらいなら儲かる時もあるかも知れません。
但し、配当が低いので大量に馬券を買わないと大儲けは出来ないです。

それで誰もが考えるのが、人気になっていない有力馬をピックアップする方法は無いだろうかと言う事でしょう。
それが、突拍子もない馬をピックアップする「データマイニング」だとか、朝方に売れた馬をピックアップする「インサイダーオッズ」になるのでしょう。
JRA-VANの「データマイニング」も、突拍子もない馬をピックアップしているだけあって、予想が的中すれば高配当を得られる事が多いですが、的中するのは極めて稀です。
JRA-VAN以外にも「データマイニング」予想を謳っている「HRPTV5C」とか言うソフトがありますが、これもほぼ毎週バージョンアップしなければならないようなレベルです。
「インサイダーオッズ」と称する方法を私も少し試して見た事がありますが、ほとんどのレースで際立った変化はありませんし、変化があったレースでも確実ではありません。
感じでは功を奏するのは、10回に1回もあれば良いぐらいなものでしょう。
私には無茶苦茶買うよりは多少は増しだろう程度の印象でした。
「インサイダーオッズ」と言うのは結局は人間の思惑の馬券の売れ方ですから、わざと負けるような八百長レースでもしない限り信頼性はないに等しいです。

そこに今回注目されている血統を用いた予想です。 (従来からあった方法ではありますが)
徹底的なデータ重視による確率の理論ですが、この方法はコンピュータは最も得意とする分野ですから、映像で人間が行っていた事を全てコンピュータ任せにする事は出来そうです。
あらかじめ膨大なデータを分析したデータベースを構築しておかなければなりませんので、プログラムを作成するのも面倒くさそうですが、血統データベースの構築にも何日も掛かりそうです。
やって見たけど無駄だったと言う事にならないように、当面は番組でやっていたように手作業でやって見ようかと思っています。
昔(2009年頃)、イギリスのデータ分析会社が競馬で160億円を稼いだと言う記事を思い出しましたが、ひょっとしたら血統分析も駆使していたのではないかとも思えてきました。

■コンピュータを使える人でも簡単ではない

軽いノリでやれるんじゃないかと思って、私も血統の基本からやり始めて見ました。
ノーザンダンサー系だとかミスプロ系だとか数系統に大分類してからやり始めたのですが、これで系統別の特徴などいくら調べても駄目なのを感じました。
大雑把過ぎて、それこそ3流競馬評論家の血統論と変わりません。(3流の競馬評論家は自分の予想を血統で裏打ちさせようとしているだけです)
番組でやっていたように、「先週の同じレースでストームキャットを父に持つ馬の勝率が良い」と言うレベルまで突き詰めようと思ったら、プログラムの構想を決めるまで1年、使えるプログラムにするためには更に2,3年は掛かるでしょう。
それでレース結果に影響する度合いは1割程度でしょうから、根気のある人でもプログラムを作る途中で挫折しますね。
亀谷敬正と言う人は「ダビスタ」で血統の知識の貯えがあるから、血統表を見ただけで競走馬にどんな血が流れているのかを一瞬で掴む事ができるでしょうが、血統の断片的な知識しかない(私のような)普通の人には、血統表を見ているだけで頭が痛くなります。

どこかの血統の解説サイトに書いてありましたが、素人がいきなり血統を理解するのは無理だから(一気に知識を詰め込もうとしても消化不良になる)、まず出走馬の父親と母親の名前を見て覚えるように心掛ける事から始めた方が良いと書いてありました。
それから父親の父親、母親の父親と言う感じで、だんだんと広くデータを眺められるようになれば、やがては血統を理解する事が出来るでしょうと言うものでした。
これが正論なのでしょうが、それでは血統を理解するのでも数年を必要としますし、そこからプログラムを書くとなると、トータルで10年程度は必要ではないでしょうか。
これではコンピュータを使える人でも血統による競馬予想プログラムを作成するのは簡単ではないです。
TARGET Frontier がやっているように、大雑把な血統を色分けして眺める程度がせいぜいのようです。
但し、こんなやり方では予想する時に混乱が増すばかりでなく、予想もさっぱり的中しなくなるでしょう。
だから、今まで血統は競馬予想には参考程度のデータ程度にしか扱われなかったのです。

■人気馬の中には血統の要素も含まれている

考えてみれば、血統など全く知らない人でもディープインパクト産駒に走る馬が多い事などは知っておりますし、走る前から実際に人気にもなっています。
人気馬との違いは何かと言うと、人気馬は血統の要素の他に過去の成績がどうだったとか、調教状態がどうだったとかの要素も数多く含まれているだけです。
そして、その方が予想方法としては合理的であるので、レース結果に反映する事が多いのでしょう。
そう考えると、血統による予想と言うのは穴馬を探すための手法であると言えるでしょう。
人気馬が競走結果に反映する事が多いとは言っても、1番人気馬が1着になる確率は3割前後ですから、残りの7割の馬を探す目的で血統理論が役に立つ場合があると考えるべきでしょう。
この方法が、「データマイニング」や「インサイダーオッズ」や「スピード指数」などよりも優れておれば良いだけの事ではないでしょうか。
多くの方法を組み合わせるのが良いだろうと言う考え方も出来ますが、それこそ「味噌・糞」を混ぜるようなもので、予想に終始がつかなくなってしまいます。

そこで自然に浮かび上がってくるのが、人気馬を主軸にしながら、血統を重視した穴馬をピックアップして有力馬に加えていくと言う方法でしょう。
亀谷敬正と言う人も、このような考え方で予想を行っていると私は思います。(映像以外は予想スタイルを見た事がありませんが)
「エクセル競馬予想 馬ちゃん」も「データマイニング」的な予想と「スピード指数」的な予想を数多く含んでおります。
ベースは過去の成績と過去の人気から配点しておりますが、その他に期待値と称して過去の連勝回数なども加えております。
その影響でJRA-VAN の「データマイニング」予想に近い予想になる事もありますし、「スピード指数」的な予想に近く成る事もあります。
的中数も回収率もそれほど悪くはありませんが、安定して儲かりませんので競馬予想の限界を感じています。

残念ながら、現在の「エクセル競馬予想 馬ちゃん」の予想では(馬券の買い方なども含めて)、馬券生活者には成れません。
それは最初から目的にしておりませんからそれでも良いのですが、馬券生活者に成れる競馬予想プログラムを作りたいとは思っています。
そうするための競馬予想に必要な安定した要素を探し続けているのですが、「亀谷敬正の血統データラボ」の中にそのヒントが含まれていないかを、もうちょっと検討したいと思います。
血統の要素を本気になって競馬予想のプログラムに組み込むのに数年は掛かると思いますので、まだまだ先の長い話になります。