エンタメ

機械学習で競馬予想して勝てるまで~非エンジニアの挑戦~(第一話)

1.非エンジニアだけど機械学習で競馬を予想したいんだ!

1-1.はじめに(自己紹介)

はじめまして。のはらと申します。エンジニアではありません。

新卒3年目です。趣味は競馬・野球・サウナです。顔も趣味もおっさんとよく言われます、が25歳です。普段はメディア部でメール広告の企画運用等を主に担当しております。

1.2.思い立ったのはら

いきなりですが、私のはらは競馬が趣味です。

(ほぼ)毎週末ウインズ、たまに競馬場に行き、馬券を購入しています。

しかし!!!最近めっきり勝てなくなってしまいました。勝率でいうと15~20%といったところでしょうか。

※ウインズ:場外馬券発売所

このままではいけない。将来のため、自分のためにも何かを変えないといけない。

前々からやりたかったことがある。この業界で働いて3年目…

”機械学習を利用して競馬を予想すればめちゃくちゃ勝てるのではないか???”

ドーン(タイトルでわかってた)

1.3.データ分析チームの同期に相談

のはら:A氏、ひとつ相談があるんだけど

A氏:何?いくらくれるの?

のはら:同期なんだからただで聞いてよ~

A氏:ラーメン一杯ね、OK

のはら:泣

のはら:あのさ、俺競馬が趣味なのね、でいくらどうしても勝率でいうと盛って20%くらいしかないんだけどさ

A氏:ひどいね、やめた方がいいよ

のはら:でも勝ちたいのよ。そしてこの間素晴らしい案を思いついたんだ。

A氏:何?

のはら:最近ニュースやら業務やらでよく聞く”機械学習”で競馬の予想すれば勝てるんじゃないの?A氏データ分析チームでしょ?教えてよ!

A氏:ww

A氏:本気?

のはら:本気。

A氏:わかった。考え方は面白い。じゃあ今から機械学習をするにあたって最低限必要なことを教える。それができそうならやってみよう(ほんとはめんどくさい)

のはら:かかってこい!!

 

2.機械学習を始めるために必要なこと

2-1.データ

A氏:まずはもちろんデータが必要だね。でもデータといっても、競馬の予測するのであれば、正解データとなる馬の順位はもちろんのこと、騎手とか競馬場の馬場状態、距離とかいろいろあるよね。しかも何を予想したいのかによって必要なデータが変わるね

基本的には”分類”で実行できると思う。1位を予想するのか、3位以内に入る確率を予測するのかとかは考える必要があるね

“回帰”という方法を使えば、例えば、タイムなどを予想してやるとかっていう方法もあるね

のはら:なるほど、じゃあこういうことね!

  1. どういう予想をしたいのか(単勝?3連単?)
  2. 利用可能なデータは何なのか
  3. 1からどんなデータを選択すれば精度があがるかという検証
  4. 以降2と3の繰り返し

A氏:すごいよのっち!(早く終わらせよっと)

※のっち:筆者のはらのあだ名

2-2.スキル

A氏:データを取得できてもすぐに機械学習ができるわけじゃないんだ。データをきれいにする作業が必要なんだ。これを実施しないと予測の精度に影響がでる。

のはら:なるほど。例えば、デムーロという騎手がいるんだけど、「M.デムーロ」と「デムーロ」がデータとして存在してしまうと、違う騎手と判定され、予測の精度が悪くなってしまう。みたいなことか。

A氏:うん。騎手は知らないけどそういうこと。具体的にはPythonの基礎を勉強してほしい。社内研修用の資料があるからそれをもとにやってみて。

のはら:わ”か”った”!!

2-3.環境

A氏:あとは環境の構築が必要だね。

のはら:そっか。うわ~考えていなかった。どうしようこれ、相談しなきゃ。

A氏:のっち、今回の件、本気なんだよね?

のはら:うん。もちろん(キリッ)

 

3.準備をしてみる

3-1.環境

A氏:そこまで本気なら、ここで環境構築までやってしまおう。もう後戻りできないよ。環境はAWSを使おう。業務でも聞いたことあるよね。はい。できた。

のはら:はやっ!すごい(何がすごいかわからないけど・・)

A氏:この画面で作業ができるようになった。

まずはAutoMLというデータがあれば簡単に機械学習してくれるものがあるからそれを使ってみよう。

勉強しながら将来的には自分でも学習させていけるようになるといいね!

のはら:そだね!

3-2.やる気

のはら:A氏。俺すごいやる気出てきた。

A氏:いいじゃん

のはら:今まで好きなことが仕事になることは少なかったけど、好きなことのために仕事できるっていいね

A氏:そうだね(熱いわぁ)

 

4.今後の展望

今回は非エンジニアであるのはらが機械学習を使用して競馬を予想するまでに何をすればよいのかを整える準備の段階であった。

第2話では実際に勉強した結果、予測してみるところまで実行したい。

楽しみにお待ちくださいませ。

 

参照:AutoML(http://docs.h2o.ai/h2o/latest-stable/h2o-docs/automl.html)


関連タグ