top of page

FIFA 2022 World Cup Network Predict

Tudo começou com uma brincadeira no trabalho. A copa estava chegando e lançamos esse desafio amigável de prever qual seleção seria a campeão da edição de 2022 da Copa do Mundo FIFA de futebol. Eu queria testar uma abordagem diferente, sempre gostei de Redes Complexas, e utilizando dados históricos de partidas e campeões anteriores, apliquei a metodologia de Adamic Adar Link Prediction para me ajudar a obter a chance de vitória das equipes a cada partida.


Redes complexas consideram a interconexão entre os elementos do sistema para identificar padrões e fornecer insights. Neste caso, construi essas relações através da quantidade de gols que as equipes já fizeram contra seus adversários. Sempre que uma equipe A fizesse um gol na equipe B, eu construiria uma ponte entre esses dois nós.


A abordagem proposta por Adamic e Adar para o problema da predição de links (relações) em redes complexas foi bem interessante para esse problema, pois a métrica mede a probabilidade de conexão entre dois nós em uma rede com base nos seus vizinhos em comum. Se dois nós (ainda não conectados) tem muitos vizinhos em comúm, existe uma maior chance deles se conectarem no futuro.

Principais insights

14.038

partidas

316

seleções

1

campeão

Conclusões

Imagine que queiramos entender a chance do Brasil ganhar da Argentina num próximo jogo da Copa do Mundo. Podemos entender históricamente quantos adversários do Brasil ja jogaram com a Argentina. Digamos que o Panamá seja um desses adversários em comúm. A ideia da métrica é contabilizar históricamente quantos gols o Brasil já fez no Panamá e multiplicar pela quantidade de gols que o Panamá ja fez contra a Argentina.


Depois, para entender o peso que o Panamá tem nessa associação, procuramos na base de dados quantos gols o Panamá ja fez em sua história. Digamos que de todos os gols feitos pelo Panamá, 35% deles tenham sido contra a Argentina. A Argentina parece ser uma grande vítima do Panamá e o Brasil já fez muitos gols no Panamá, então provavelmente o Brasil poderá fazer muitos gols contra a Argentina.


Esse processo se repete considerando todos os adversários em comúm entre Brasil e Argentina até gerarmos a métrica para o lado brasileiro. Posteriormente invertemos a ordem e calculamos a métrica para saber a chance dos argentinos ganharem dos brasileiros. A seleção que tiver o maior valor nessa comparação provavelmente ganhará o próximo duelo.


A ideia era boa, mas o viés histórico das 5 copas do mundo ganhadas pelo brasil não conseguiu superar a crise recente iniciada depois do fatídico 7 a 1. Após termos previsto a ordem final da competição como 1) Brasil 2) Inglaterra 3) Alemanha e 4) Argentina, a dura realidade nos mostrou que os hermanos que na verdade levariam a taça para casa. Mas tudo bem, a curiosidade venceu e uma nova habilidade foi desenvolvida por aqui. Saiba mais sobre o código acessando os links espalhados nessa página.

Apresentação

Captura de Tela 2024-06-18 às 01.51.23.png

Galeria de imagens

Continue explorando outros temas...

Duolingo Exploratory Analysis

Uma análise exploratória de dados públicos do aplicativo de aprendizagem de idiomas mais popular do mundo.

Music System Recommendation

Explorando um sistema de recomendação de músicas por conteúdo utilizando abordagens como NLP e KNN.

Spaceship Titanic Random Forest

Prevêndo passageiros transportados para outra dimensão durante a colisão da nave espacial Titanic!

Movie System Recommendation

Desenvolvendo um sistema de recomendação de filmes utilizando Redes Complexas, SVD e Link Prediction.

Data Analytics Manager

Se conecte comigo!

Inscreva-se neste site para ficar por dentro de todas as novidades!

Me siga pelas redes!

  • Captura de Tela 2024-06-02 às 17.03.21
  • GitHub
  • LinkedIn

/aravinii

© 2024 Vinicius Araujo. Todos os direitos reservados.

bottom of page