Po 100 000 počítačových simulacích je jasno: Kdo vyhraje nadcházející mistrovství světa ve fotbale?
InovaceZatímco v roce 2010 se svět spoléhal na předpovědi chobotnice Paula, dnes se do hry zapojuje umělá inteligence. Vědci z The Conversation provedli 100 000 počítačových simulací nadcházejícího mistrovství světa ve fotbale, aby určili nejpravděpodobnějšího vítěze.
Zatímco v roce 2010 se svět spoléhal na předpovědi chobotnice Paula, dnes se do hry zapojuje umělá inteligence. Vědci z The Conversation provedli 100 000 počítačových simulací nadcházejícího mistrovství světa ve fotbale, aby určili nejpravděpodobnějšího vítěze. Simulace zohlednily oficiální los turnaje, všechna pravidla FIFA, včetně prodloužení a penaltových rozstřelů.
Výsledky ukazují, že hlavním favoritem na titul je Španělsko s pravděpodobností výhry 14,5 %. Těsně za ním následují Anglie a Francie, obě s 12,4 %, a Německo s 11,2 %. Vzhledem k rozšířenému formátu turnaje, který nyní zahrnuje 48 týmů a pět kol ve vyřazovací fázi, je skupina favoritů velmi vyrovnaná. Portugalsko a Argentina mají také dobré šance na vítězství, s 8,9 % a 8,2 %.
Spojené státy mají vysokou šanci dosáhnout osmifinále (78 %), což je nejvyšší v jejich skupině. Ve vyřazovací fázi, kde je každý zápas rozhodující, však pravděpodobnost postupu amerického týmu rychle klesá. Pravděpodobnost domácího vítězství ve finále na stadionu MetLife v New Jersey 19. července je 1 %.
Jak funguje predikční model?
Algoritmus strojového učení a následné simulace jsou založeny na kombinaci dat, odborných znalostí a statistických modelů. Nejprve se z národních zápasů za posledních osm let odhaduje síla týmů. Dále se využívají kurzy mezinárodních sázkových kanceláří, které odrážejí jejich expertní názory na nadcházející turnaj. Třetí složkou jsou hodnocení jednotlivých hráčů na základě jejich příspěvků k gólům na klubové i národní úrovni. Nakonec se zohledňuje aktuální kvalita a budoucí potenciál hráčů, vyjádřený jejich očekávanou tržní hodnotou z webu Transfermarkt, který využívá metodu „moudrosti davu“.
Tyto čtyři proměnné jsou doplněny širokou škálou dalších relevantních vstupů, které odrážejí aktuální stav týmů a zemí, ze kterých pocházejí. Patří sem specifické detaily týmu, jako je jejich žebříček FIFA a počet hráčů v semifinále letošní Ligy mistrů. Zohledněny byly i socioekonomické faktory specifické pro danou zemi, například HDP na obyvatele.
Pro určení relevance těchto faktorů pro skutečné výsledky na mistrovství světa byl použit algoritmus strojového učení, konkrétně takzvaný náhodný les. Ten byl trénován na všech zápasech odehraných na velkých fotbalových turnajích od mistrovství světa v roce 2006. Algoritmus tak propojuje sílu týmu, tržní hodnotu a další faktory s počtem vstřelených gólů v zápasech mistrovství světa, což je informace, která „zatěžuje kostky“ pro simulace.
Model již v minulosti prokázal svou schopnost, když správně předpověděl vítězství USA na mistrovství světa žen v roce 2019. Na mistrovství světa žen v roce 2023 a mistrovství světa mužů v roce 2022 sice vítězové (Španělsko a Argentina) nebyli hlavními favority modelu, ale byli označeni za vážné uchazeče. Předpovědi jsou vždy o pravděpodobnostech, ale tento program nabízí mnohem sofistikovanější pohled než jakákoli chobotnice.