FIFA 2022 World Cup Network Predict

Tudo começou com uma brincadeira no trabalho. A copa estava chegando e lançamos esse desafio amigável de prever qual seleção seria a campeão da edição de 2022 da Copa do Mundo FIFA de futebol. Eu queria testar uma abordagem diferente, sempre gostei de Redes Complexas, e utilizando dados históricos de partidas e campeões anteriores, apliquei a metodologia de Adamic Adar Link Prediction para me ajudar a obter a chance de vitória das equipes a cada partida.
Redes complexas consideram a interconexão entre os elementos do sistema para identificar padrões e fornecer insights. Neste caso, construi essas relações através da quantidade de gols que as equipes já fizeram contra seus adversários. Sempre que uma equipe A fizesse um gol na equipe B, eu construiria uma ponte entre esses dois nós.
A abordagem proposta por Adamic e Adar para o problema da predição de links (relações) em redes complexas foi bem interessante para esse problema, pois a métrica mede a probabilidade de conexão entre dois nós em uma rede com base nos seus vizinhos em comum. Se dois nós (ainda não conectados) tem muitos vizinhos em comúm, existe uma maior chance deles se conectarem no futuro.
Principais insights
14.038
partidas
316
seleções
1
campeão
Conclusões
Imagine que queiramos entender a chance do Brasil ganhar da Argentina num próximo jogo da Copa do Mundo. Podemos entender históricamente quantos adversários do Brasil ja jogaram com a Argentina. Digamos que o Panamá seja um desses adversários em comúm. A ideia da métrica é contabilizar históricamente quantos gols o Brasil já fez no Panamá e multiplicar pela quantidade de gols que o Panamá ja fez contra a Argentina.
Depois, para entender o peso que o Panamá tem nessa associação, procuramos na base de dados quantos gols o Panamá ja fez em sua história. Digamos que de todos os gols feitos pelo Panamá, 35% deles tenham sido contra a Argentina. A Argentina parece ser uma grande vítima do Panamá e o Brasil já fez muitos gols no Panamá, então provavelmente o Brasil poderá fazer muitos gols contra a Argentina.
Esse processo se repete considerando todos os adversários em comúm entre Brasil e Argentina até gerarmos a métrica para o lado brasileiro. Posteriormente invertemos a ordem e calculamos a métrica para saber a chance dos argentinos ganharem dos brasileiros. A seleção que tiver o maior valor nessa comparação provavelmente ganhará o próximo duelo.
A ideia era boa, mas o viés histórico das 5 copas do mundo ganhadas pelo brasil não conseguiu superar a crise recente iniciada depois do fatídico 7 a 1. Após termos previsto a ordem final da competição como 1) Brasil 2) Inglaterra 3) Alemanha e 4) Argentina, a dura realidade nos mostrou que os hermanos que na verdade levariam a taça para casa. Mas tudo bem, a curiosidade venceu e uma nova habilidade foi desenvolvida por aqui. Saiba mais sobre o código acessando os links espalhados nessa página.
Apresentação

Galeria de imagens


