top of page

Airline Passengers Random Forest

Como mencionado anteriormente, a paixão pela classificação por Random Forest é evidente ao longo deste site, rsrsrsss. Um exemplo recente dessa preferência foi a descoberta de uma base de dados no Kaggle que compilava pesquisas de satisfação de passageiros em voos de uma companhia aérea não identificada. Com um total de 129.880 respostas e 23 variáveis explicativas, o conjunto de dados continha informações valiosas, como gênero, idade, destino, despesas durante a viagem e serviços adquiridos.


O projeto teve início com uma análise exploratória de dados abrangente (EDA) para examinar a distribuição e a concentração dos valores, além de investigar a correlação entre as variáveis. Posteriormente, a preparação para a implementação do modelo Random Forest foi realizada, incluindo a criação de variáveis booleanas e a divisão dos dados em conjuntos de treinamento (70%) e teste (30%). Esse processo foi fundamental para garantir a eficácia e a precisão do modelo, permitindo a avaliação do desempenho e a otimização dos resultados.

Principais insights

129.880

avaliações

23

variáveis

97%

precisão

Conclusões

Após a conclusão da construção do modelo de Random Forest com parâmetros iniciais padrão, procedemos à avaliação minuciosa do desempenho do modelo. Utilizamos métodos como a curva ROC e a matriz de confusão, além de métricas fundamentais como acurácia, precisão, recall, sensibilidade, especificidade e F-1 para obter uma visão abrangente da eficácia do modelo.


O threshold de 0.5 revelou uma precisão média impressionante de 97% e um recall sólido de 94%, demonstrando a capacidade do modelo em identificar corretamente as classes. Ao analisar as variáveis mais relevantes para a predição, destacamos a importância da satisfação com o check-in online, a presença de serviços de Wi-Fi a bordo, o propósito da viagem (seja a trabalho ou pessoal), a classe da passagem e a qualidade do entretenimento a bordo como fatores determinantes.


Essas descobertas reforçam a robustez do modelo construído e fornecem insights valiosos para aprimorar ainda mais a precisão e eficácia das previsões. A análise detalhada das variáveis e métricas utilizadas destaca a importância da abordagem metodológica adotada, garantindo resultados confiáveis e relevantes para a tomada de decisões informadas no contexto em questão.

Apresentação

Captura de Tela 2024-06-18 às 01.51.23.png

Galeria de imagens

Continue explorando outros temas...

Duolingo Exploratory Analysis

Uma análise exploratória de dados públicos do aplicativo de aprendizagem de idiomas mais popular do mundo.

Music System Recommendation

Explorando um sistema de recomendação de músicas por conteúdo utilizando abordagens como NLP e KNN.

Spaceship Titanic Random Forest

Prevêndo passageiros transportados para outra dimensão durante a colisão da nave espacial Titanic!

Movie System Recommendation

Desenvolvendo um sistema de recomendação de filmes utilizando Redes Complexas, SVD e Link Prediction.

Data Analytics Manager

Se conecte comigo!

Inscreva-se neste site para ficar por dentro de todas as novidades!

Me siga pelas redes!

  • Captura de Tela 2024-06-02 às 17.03.21
  • GitHub
  • LinkedIn

/aravinii

© 2024 Vinicius Araujo. Todos os direitos reservados.

bottom of page