研究紹介

サッカーの監督は、強化学習的にフォーメーションを変更するが、勝利に結びついてるというわけではない

キーワード:強化学習,スポーツ,データ

監督の意思決定がチームの成績を大きく左右するだろうことは想像に難くない。

本研究では、日本とドイツのデータを用いて、次の2つの仮説を検証した。

  • 仮説1:監督が行う試合ごとのスターティング・フォーメーション(下図)変更は、強化学習に従った行動と見なせる。
  • 仮説2:強化学習に従ったフォーメーション変更によって、チーム成績が向上する。
図:サッカーのフォーメーションの模式図.このような画像データからスターティング・フォーメーションを抽出して解析を行った。

強化学習とは、もしうまくいったら現在の行動を次回も行いやすくして、もしうまくいなかったら現在の行動の頻度を減らしてみることである。これによって、学習が行われるに連れて、以前よりも多い報酬を得ることができると期待される。今回のデータ解析で言えば、もし試合に負けたら次の試合ではフォーメーションを変更する可能性が高くなり、勝ったら次の試合でも同じフォーメーションを用いる可能性が高いということである。

なお、スターティング・フォーメーションのデータを用いたのは、そのようなデータが公開されていて利用可能だったからである。データ解析には、多重線形回帰などの標準的な統計手法を用いた。

データ解析の結果、仮説1は指示され、仮説2は指示されなかった。すなわち、監督は強化学習を(無意識的にしろ)行っているという手がかりがデータから得られたが、だからといって強化学習が勝率を上げてはいなかった。負けたからといってコロコロ変えるのは良くないかもしれない。