Movie System Recommendation

Este projeto foi idealizado durante o desenvolvimento do meu MBA em Data Science, visa construir um sistema de recomendação para filmes e utiliza como referência prática os notebooks apresentados em Film recommendation engine, Netflix Visualizations, Recommendation, EDA e Getting Started with a Movie Recommendation System, além é claro de referências teóricas como A hybrid recommender system based-on link prediction for movie baskets analysis e Recommender Systems Handbook.
O estudo foi pautado em cima da base de dados MovieLens 100k Dataset, objeto que representa a coleta de 100.000 avaliações (que variam de 1 a 5) de 943 usuários sobre 1.682 filmes do site MovieLens entre os anos de 97 e 98. Também está disponível as informações básicas de cada usuário na base, praticamente encontramos Gênero, Idade, Profissão e Endereço.
O sistema funciona a partir de uma função que pode receber como parâmetro o ID de um usuário ou o ID de um filme, e retorna uma lista dos filmes mais próximos da referência dada. Indicando uma boa recomendação futura.
Principais insights
35.8%
precisão
12.7%
cobertura
72.9%
personalização
Conclusões
O equilíbrio entre as métricas de avaliação apresentadas nos levou a entender que a abordagem híbrida de Adamic Adar Link Prediction com ordenação dada por Single Value Decomposition obteve o melhor desempenho geral entre todas as abordagens estudadas.
Pela simplicidade de cálculo e pelos resultados razoáveis obtidos em cada métrica de avaliação, a abordagem baseada em Agrupamento Hierárquico com Popularidade seria uma boa alternativa aos casos em que não há o histórico de interações do usuário.
Finalmente, entende-se que seria interessante explorar em trabalhos futuros os valores ideais dos parâmetros definidos em cada abordagem deste trabalho e também os impactos nas métricas de avaliação com uma utilização conjunta dessas duas abordagens.


