YAPC::Fukuoka 2025
トーク(40分)
当日の配信可(OK) アーカイブ配信可(OK)

競馬で学ぶ機械学習の基本と実践

shohei1913 三谷 昌平 shohei1913
3

最近、大規模言語モデル(LLM)が急速に普及していますが、すべての分野でLLMが万能というわけではありません。例えば、金融やセキュリティといった高い信頼性が求められる業界では、回帰やブースティング系の "古典的な" 機械学習の技術が、今なお第一線で活躍しています。

その理由は、旧来の機械学習では「この取引は不正利用の可能性が80%」といったように確率を使って物事を予測したり、「なぜそのように予測値が出たのか」という理由を人間が理解しやすい形で説明できる点にあります。身近な例では、金融での与信スコアリングやカード決済や送金等の不正利用の検知などの "予測タスク" に機械学習が今でも使われています。

このトークでは、機械学習のユニークなポイントと私が機械学習を好きな理由について、過去に熱中して作っていた "競馬" を題材にお伝えします。勘や経験則、あるいは人間が地道に作るルールだけでなく、機械学習という道具を手に入れると、競馬の収支を改善するためにどのようなアプローチが可能になるのか? 最近話題のLLMに尋ねるのとは、何が違うのか?私の過去の実践経験を元に、詳しく説明します。

機械学習について初めて知る人でも楽しめるよう、以下の流れでお話しする予定です。

  • 機械学習の基本
    • 機械学習とは何か?特に教師あり学習について
    • 機械学習が使われている分野
    • 機械学習の利点と欠点
    • 機械学習のシステム構築の流れ
    • 最近の機械学習の潮流
  • 競馬と機械学習
    • 競馬の簡単な紹介
    • 競馬に適した機械学習手法の紹介
  • 競馬の勝ち馬予測モデルの作り方
    • 予測の元になるデータを集める
    • 予測の精度を高めるための特徴量エンジニアリング
    • 予測モデルの構築方法と評価手法
  • 勝ち馬予測モデルの実践
    • 予測値の活用方法
    • 実戦での評価検証