top of page

Movie System Recommendation

Este projeto foi idealizado durante o desenvolvimento do meu MBA em Data Science, visa construir um sistema de recomendação para filmes e utiliza como referência prática os notebooks apresentados em Film recommendation engine, Netflix Visualizations, Recommendation, EDA e Getting Started with a Movie Recommendation System, além é claro de referências teóricas como A hybrid recommender system based-on link prediction for movie baskets analysis e Recommender Systems Handbook.


O estudo foi pautado em cima da base de dados MovieLens 100k Dataset, objeto que representa a coleta de 100.000 avaliações (que variam de 1 a 5) de 943 usuários sobre 1.682 filmes do site MovieLens entre os anos de 97 e 98. Também está disponível as informações básicas de cada usuário na base, praticamente encontramos Gênero, Idade, Profissão e Endereço.


O sistema funciona a partir de uma função que pode receber como parâmetro o ID de um usuário ou o ID de um filme, e retorna uma lista dos filmes mais próximos da referência dada. Indicando uma boa recomendação futura.

Principais insights

35.8%

precisão

12.7%

cobertura

72.9%

personalização

Conclusões

O equilíbrio entre as métricas de avaliação apresentadas nos levou a entender que a abordagem híbrida de Adamic Adar Link Prediction com ordenação dada por Single Value Decomposition obteve o melhor desempenho geral entre todas as abordagens estudadas.


Pela simplicidade de cálculo e pelos resultados razoáveis obtidos em cada métrica de avaliação, a abordagem baseada em Agrupamento Hierárquico com Popularidade seria uma boa alternativa aos casos em que não há o histórico de interações do usuário.


Finalmente, entende-se que seria interessante explorar em trabalhos futuros os valores ideais dos parâmetros definidos em cada abordagem deste trabalho e também os impactos nas métricas de avaliação com uma utilização conjunta dessas duas abordagens.

Apresentação

Captura de Tela 2024-06-18 às 01.51.23.png

Galeria de imagens

Continue explorando outros temas...

Duolingo Exploratory Analysis

Uma análise exploratória de dados públicos do aplicativo de aprendizagem de idiomas mais popular do mundo.

Music System Recommendation

Explorando um sistema de recomendação de músicas por conteúdo utilizando abordagens como NLP e KNN.

Spaceship Titanic Random Forest

Prevêndo passageiros transportados para outra dimensão durante a colisão da nave espacial Titanic!

Text classification for brazilian news

Aplicando técnicas de NLP para a limpeza, preparo e aplicação de modelos de classificação de temas em notícias em português

Data Analytics Manager

Se conecte comigo!

Inscreva-se neste site para ficar por dentro de todas as novidades!

Me siga pelas redes!

  • Captura de Tela 2024-06-02 às 17.03.21
  • GitHub
  • LinkedIn

/aravinii

© 2024 Vinicius Araujo. Todos os direitos reservados.

bottom of page