「人間の肌感覚を超えたところの客観的な指標を提示すると、サッカーの見方が魅力的になることを期待しています」
そう語ったのは、株式会社JX通信社で上級執行役員 兼 CXOを務める細野雄紀さん。JX通信社は、カタール・ワールドカップ(W杯)に向けて、「サッカーW杯 勝敗確率&優勝国AIシミュレータ(以下、AIシミュレータ)」を開発し、サービス展開している。
勝敗予想というのは大きな大会になれば必ずと言っていいほど行われ、元選手や現役選手、解説者など数多くの人が、しかも世界各国で行われ、それぞれの意見がぶつかり合うもの。そして、サッカーファンも仲間内で行うほど、定番のコンテンツとなっている。
中には、タコやネコ、パンダ、カワウソなど、動物の予想も登場し、高い的中率が大きな話題になったこともある。
ただ、動物などの選択は直感どころか、何も考えていないで選んでいるはずであり、人の予想はそれぞれのバイアス(かたより)が掛かり、当たらない確率が高まってしまうこともある。
例えば、カタールW杯で日本がグループステージを首位通過すると予想した人はどれだけいたのか。また、ドイツ代表とスペイン代表に勝利し、コスタリカ代表に負けると予想した人がどれだけいたのか。その数は多くはないはずだ。
その理由は、バイアスが掛かり希望的観測になってしまうためだが、そのバイアスを一切排除したものがこの「AIシミュレータ」となる。今回は開発に関わった、JX通信社執行役員 兼 データアナリスト/ 情勢調査 事業責任者の衛藤健さん、そして細野さんにインタビューを行った。
◆ベースは選挙の当選確率シミュレータ
[サッカー好きでこだわりを持ってAIシミュレータを作った細野雄紀さん]
今回の「AIシミュレータ」を開発するにあたり、衛藤さんはAI分析の数理モデルを、細野さんは見せ方や必要なデータ、細かい調整を行ったという。しかし、そのスタートはまさかの開幕が迫った11月初旬だったと細野さんが明かした。
「個人的に20年以上サッカーが好きで、W杯の試合予想をAIでやっていく企画を提案したのが11月の初旬だったんですが、そこから急ピッチで立ち上げて、無事にリリースになったという形です」
リリースされたのがカタールW杯前の11月18日、つまり企画から3週間もかけずに完成形にまで持っていったというから驚きだ。
AIと聞くと、一般的には非常に複雑なものという印象が強く、そんな短時間で機能させることなどできないと考えてしまうが、関わったのは3名だと衛藤さんは語った。
「本当に急ピッチで進みました。実は私たち以外でもう1人、インターン的に関わっている人がいて、サッカーに詳しい方でした。
「私と細野と3人でこういうデータを集めたら良いのではないかということを急ピッチに議論して、急ピッチにデータを集めてスタートしました」
たった3人で、データを集めてから完成まで持っていったというが、それにはベースになったものがあったという。それが2022年7月の参院選で開発した「当選確率シミュレータ」だった。
「実はベースになるノウハウがあって、サッカーやW杯の分析は初めてですが、今年の夏の参院選の予測をはじめ選挙まわりのAIを使ったシミュレーション自体はずっとやってきました」と語る細野さん。「そこで数理モデルを構築し、精度を高めるためのノウハウがあったので、今回は違う分野に転用して実現しました。だから急ピッチでもどうにか間に合った感じです」と、ベースがあったからこそのスピード開発が実現できたという。
ただ、選挙とサッカーのW杯では大きく状況が異なるはず。衛藤さんは「選挙だと、例えば候補者が10人いて、その中から1人選ぶとか、単純なものでしたが、サッカーの場合はチームvsチームの試合でありながらも、チームを構成する人、1人1人の選手が11人いて成り立つものなので、1人1人の能力をどう置くのか。その辺りに関しては、結構ドメイン知識(専門分野に特化した知識)が必要で、選挙とは違ったかなと思います」と、ベースはありながらも考え方は違ったという。
一方で、細野さんは共通する考えを持っていると語り、「参院選を1つの大会とみなすと共通するところは結構あります。今回のW杯では、1万回の大会を擬似シミュレーションしているのですが、参院選も同じく1万回試行して、当選確率を出していました。1万大会を行えば、日本が優勝する場合も、あるいは自民党が相当議席を失う場合も起こり得ます。そういう意味で、ノウハウとして共通しているかなと思います」と語り、発生回数は少ないながらもイレギュラーな結果はどちらも出るという共通項もあるとした。
◆想像以上に細かいデータ分析
[AI分析シミュレータの数理モデルを作った衛藤健さん]
とは言え、選挙に関しては、不祥事やスキャンダルなど社会的な問題となることが起きない限りは、なかなか大番狂わせということは起こりにくいもの。事前の票読みはおおよそ当たることが通例だ。一方で、サッカーの試合の場合は、選手の能力値はもちろんのこと、コンディションや起用方法など、様々に変動することが多く、さらに対戦カードごとの相性や傾向も存在する。
しかし、そこに関しては細かいデータを用意したと衛藤さんは語る。
「個々の選手について、攻撃とか守備とか、そういうレベルのスコアを独自の指標を使って算出して、それを選手1人1人やって、それを26人ずつつけ、加重平均(特定の数値に対して、他の数値よりも重要度が高いことを加味した平均値)というものでつけていくということやっています」
「例えばケガ人が出たとか、欠員が出た、監督と仲違いをして試合全然使われないとか、そういうことにも対応できる仕組みにはしています」
実にサッカーらしい事象を考慮した構造となっており、実際のカタールW杯でもカメルーン代表GKアンドレ・オナナが途中でW杯を離れることが発生。また、個人的な事情でイングランド代表DFベン・ホワイトが帰国。また、大会中のケガでプレーが不可能になった選手が出るなど、準備していたことが実際にも起きていた。
細野さんは「チームごとの相性の話もありますが、選手が持っているスキルを指標化することに加えて、例えばカタールリーグで活躍している選手がカタールで活躍することはイメージが湧きますが、一方で南米からわざわざ来ると移動距離やコンディション調整が難しいといった変数も裏では加味しています」とコメント。環境やコンディション面なども変数を用いて影響を与えることができる仕組みになっているという。
また、衛藤さんは選手の調子にも注目。「能力が高かったとしても調子の波がもちろんあるわけで、調子の波をきちんと反映できる仕組みも採用しています。例えば、直前の親善試合での結果、W杯が進んでいく中で試合が増えていくので、その結果、相手の強さというのも加味して計算しています」と、目に見える範囲での選手の変化にも対応が可能だという。言うなれば、ゴールを決め続ける選手が出て来ればプラスに働き、期待されながらもパフォーマンスが悪ければマイナスに働くというようなことだ。
加えて、細野さんはW杯という大会が持つ特異性も加味していると語り、「例えばキリンチャレンジカップのような親善試合と、W杯というのは決定的に異質だと思います。代表チームごとの戦力分析も当然やっていますが、W杯という大会フォーマット固有の傾向に対しての変数も組み入れています」とコメント。「よく言われる初戦で勝つと圧倒的に有利とか、初戦で負けると圧倒的に不利というのもありますが、そういうところのW杯の傾向も加味されています」と、過去のW杯で実際に起こっている傾向も加味されて結果が出る仕組みになっているようだ。
「日本代表は初戦の前は、グループリーグの突破は33%ぐらいでしたが、(ドイツ戦後に)70%超に跳ね上がったのは、日本代表のコンディションだけでなく、そういうW杯特有の傾向も過去のデータから出されているということです」とコメント。勝った、負けたという結果だけでは算出されていないという。
◆分析結果の精度は80〜90%
[大会前に出された分析結果、グループステージ突破国の的中率?]
より現実のサッカーで起こりそうなことまで細分化して分析を行っている「AIシミュレータ」。ただ、試作段階からリリースまでの間には、順調にいかないものもあったという。
「僕は結構こだわりがあるので、数理モデルを構築していたときにアルファ版、ベータ版、完成版と何度か強化していきましたが、一番最初の初期モデルでは、ブラジルやアルゼンチンが優勝候補ではなかったんです」と細野さんは明かす。その理由は、指標の1つとして入れた「移動距離」が影響を与えすぎていたからだという。
「アルファ版ではセルビアが有力な優勝候補で、欧州国が過大評価されていた印象がありました。それは移動距離によるコンディション不良がかなり加味された結果になっていたからなんですが、蓋を開けてみると開催国のカタールはホームアドバンテージが生きず、初戦で負けてしまいました。移動のアドバンテージは結局あまり効いていないなと。大会前にそういった部分を修正することができたので、結果的には確率の高いシミュレーション結果になったと思います」
サッカー好きの細野さんの感覚、そしてサッカーに明るくない衛藤さんのデータに基づいた数理モデルが合わさり、今回の「AIシミュレータ」が完成した。
最初に完成したものとリリースされたものの違いについては「移動距離というものを必要以上に加味しすぎていたので、よりカタールから遠い南米のチームが過小評価されるというものにはなっていました」と衛藤さんは語る。
細野さんは「概ね今のモデルの方が、肌感覚としても近いですし、今起きているグループリーグの結果を見ても確からしいという感じがしていて、ブラジル代表の優勝確率が一番高いんですが、どのデータ分析会社も同じ様な予測結果だと思います。初期のバージョンに比べると、格段に確度は高いのかなと思います」と、実際に残っている結果との差もあまりない感じがするとした。
では一体どれくらい信じて良いものなのか。衛藤さんは「事前の確認作業をしていた時は8割〜9割ぐらい当たっていました」とコメント。それには考え方の違いがあり、「普通は勝ち、引き分け、負けをしっかり当てるというものになると思います。ただ、結果的に引き分けになった試合は、どっちが勝ってもおかしくなかったと考え、勝ち、負け、引き分けのどれで予想しても間違ってはいないと考えました」と、引き分けと言いながらも、どちらも勝つ確率があったと考え、「二回引き分けだったという試合は除外しました。勝ちと負けがしっかりついたケースは、9割近くありました。かなり高い精度になっていると思います」と、勝敗がつくようなモデルになっているとのこと。ただ、「それでも10%ぐらいは番狂わせの要素があったので、そこがサッカーの面白さかなと思います」と、番狂わせが起こる可能性もしっかりと残る結果になるとした。
細野さんも、結果については実際に起こった試合でも、どちらに転ぶか分からないものは多いと語る。
「日本とコスタリカとの試合では、46%が日本の勝利、34%はコスタリカの勝利で、残りは引き分けでした。実際の試合前のムード的には、95%ぐらい日本が勝つだろうという空気だったと思いますが、実際の数字はちょっと勝率の高いジャンケンの様なもの。蓋を開けてみると、どっちに転んでもおかしくない試合だったと思います」
「仮に、伊東純也が抜け出してファウルで止められたシーンがPKだったとしたら、日本が勝っていたかもしれない。あそこで、伊東純也が抜け出した時にPKだったとしたら、日本が勝っていたかもしれない。あの50cmの差が勝敗を分けたと思います」
「2018年の時もコロンビア戦で相手がハンドでレッドカードになり、PKを取れなかったらまったく違う展開になっていたと思います。そういう意味で言うと、どっちに転んでもおかしくなかったんだなと」
「勝敗確率は人間の肌感覚から逸脱している様に見えますが、そういったものを超えて客観的に見ると言う意味では面白いと思います。人間の肌感覚を超えたところの客観的な指標を提示することで、サッカーの見方が魅力的になることを期待しています」
今回の「AIシミュレータ」では、採用されていないものの、試合中のデータを取り込んで分析するような仕組みを作れば、シュート数やボール支配率など、試合の動きに合わせて勝率が変動するものも開発は可能だという。
ただ、「今の分析はミクロというよりは、マクロのデータの分析なので、試合中に起こるできごとを細かく分析するよりも、結局勝ったのか負けたのか、何点入ったのかというアプローチでモデルを構築しました」と細野さんは語り、最終結果がどうなるかという確率を算出するものになっているとした。
◆今後はサッカーはもちろん、他スポーツや非スポーツにも
[3人のチームで作り上げたAIシミュレータ、未来はどうなるのか]
「AIシミュレータ」が算出する確率は、毎日更新されるが、これは毎日1万回のW杯を開催し、そのデータから算出された数字となっている。毎日6万4000試合の結果が1つずつ出され、それをもとに算出された数字。妙に納得感があり、説得力を感じる数字になっているのは、そこが理由だと言える。
加えて、選手個々のデータも短期のデータを採用しており、過去の高い能力やコンディションなどは加味しない状況に。より今大会に参加している選手の状況が反映されるようになっているという。
そういった点では、大会前の各グループの突破確率を見た際に、各グループで最も高い数字が出ていながら敗退となったのはグループFのベルギー代表(71.8%)のみ。他のグループは70%以上の突破確率が弾き出された国は全て決勝トーナメントに進出している。ベルギーもクロアチア代表戦では、勝利してもおかしくない展開だっただけに、ほとんど当たっていたと言っても良いのかもしれない。
一方で、各グループで最も突破の確率が低い国で実際は決勝トーナメントに進出したのもグループDのオーストラリア代表だけ。ベスト16でみれば、11カ国が当たっており、的中率は68.75%という結果だった。より調整を行えば、その精度はさらに上がることも考えられるだろう。
人々の熱狂とは裏腹に、冷静にデータから分析した結果を弾き出す「AIシミュレータ」だが、バイアスがかからない分、リアルな数字と言っても良い。
このAIの分析を今後どう発展させていくのか。衛藤さんは「サッカーに限らず、色々なスポーツで生かせると思います」と語り、「野球は典型的な例ですが、数理的な分析、確率を使って作戦が変わったり、選手の動きに影響したりしています」と、試合の進行が止まる野球では、選手ごとの投手の配球や守備、プレーの選択などもデータを基にされており、特にメジャーリーグではその傾向が強い。
「そういうことを考えると、サッカーだけじゃなく野球やラグビーなど、色々なスポーツでもできると考えています。将来的に他のスポーツだったり、サッカーもJリーグなどにも予測の対象を広めていく可能性は十分あると思います」と衛藤さんは展望を語った。
また、細野さんは「もともと我々はスポーツではなく選挙の予想から入っているので、究極言うと大会の様なものであれば、スポーツじゃなくても予想できます」と語り、「引き続き我々はスポーツも挑戦していきますが、選挙や非スポーツの分野で分析や予測をしていくことは1つ我々のミッションだと思っています」と、様々な分野での数値分析をしていくことに使っていきたいとした。
ちなみに、勝敗の確率を算出するとなれば、スポーツベッティングに生かしたいと考える人も現れるだろう。細野さんは「人間のバイアスや感覚でオッズは決まってしまうので、あまり客観的な指標にはならない印象です」と語り、「バイアスに基づかずに、過去の成績、W杯の傾向、選手のコンディションというものを数理モデル化した上で、数理モデル化した上で、勢いや空気に惑わされずシミュレーションするほうが、結果的には賭け事にも使えると思います」と、よりシビアな数値を見ていくことはできると語った。
また、「ドイツ戦に勝った後は、W杯が始まる前は3試合全て厳しいという感じだったのに、いきなりコスタリカは余裕という空気になりました。人間の群集心理や危うさ、脆さを、改めて目の当たりにしました」と、どうしても人間の感覚ではブレが生まれてしまうとし、「人間の心理をベースにした推測や予測は、W杯の様なお祭りごとであればあるほど、当てにしてはいけないなと感じました」と、バイアスが掛かりやすい状況であればあるほど、AIの分析は活用できるかもしれないとした。
企画を出した細野さんは、最後に意外な言葉を残した。
「衛藤は元々サッカーは好きでもないし、詳しくもない人間ですが、ある種バイアスをかけずに数理モデルを構築した結果、サウジアラビアがアルゼンチンに10%勝率あるんだというものを、決め込まずに作れたことが、結果的に良かったなと思っています」
「サッカー好きが作ると、アルゼンチンはもっと勝率あるでしょうと思ってしまうかもしれないですが、詳しくないからこそ、バイアスがかからずにドライにジャッジをして開発できた側面はあるなと思いました」
サッカー好きの細野さんのこだわりと、データ分析に長けた衛藤さんの力が合わさった結果が、納得感のある結果を生み出す「AIシミュレータ」を生み出したと言えそうだ。4年後のW杯では、より精度の高いものが誕生しているかもしれない。
取材・文:菅野剛史(超ワールドサッカー編集部)
【画像】カタールW杯はベスト8が揃う、最新の勝率は!?
■勝敗確率&優勝国AIシミュレータ
毎日更新される最新のシミュレーション結果をチェック
■JX通信社
https://jxpress.net/
▷ NewsDigestダウンロードURL
「NewsDigest」アプリダウンロードはこちらから