Airline Passengers Random Forest

Como mencionado anteriormente, a paixão pela classificação por Random Forest é evidente ao longo deste site, rsrsrsss. Um exemplo recente dessa preferência foi a descoberta de uma base de dados no Kaggle que compilava pesquisas de satisfação de passageiros em voos de uma companhia aérea não identificada. Com um total de 129.880 respostas e 23 variáveis explicativas, o conjunto de dados continha informações valiosas, como gênero, idade, destino, despesas durante a viagem e serviços adquiridos.
O projeto teve início com uma análise exploratória de dados abrangente (EDA) para examinar a distribuição e a concentração dos valores, além de investigar a correlação entre as variáveis. Posteriormente, a preparação para a implementação do modelo Random Forest foi realizada, incluindo a criação de variáveis booleanas e a divisão dos dados em conjuntos de treinamento (70%) e teste (30%). Esse processo foi fundamental para garantir a eficácia e a precisão do modelo, permitindo a avaliação do desempenho e a otimização dos resultados.
Principais insights
129.880
avaliações
23
variáveis
97%
precisão
Conclusões
Após a conclusão da construção do modelo de Random Forest com parâmetros iniciais padrão, procedemos à avaliação minuciosa do desempenho do modelo. Utilizamos métodos como a curva ROC e a matriz de confusão, além de métricas fundamentais como acurácia, precisão, recall, sensibilidade, especificidade e F-1 para obter uma visão abrangente da eficácia do modelo.
O threshold de 0.5 revelou uma precisão média impressionante de 97% e um recall sólido de 94%, demonstrando a capacidade do modelo em identificar corretamente as classes. Ao analisar as variáveis mais relevantes para a predição, destacamos a importância da satisfação com o check-in online, a presença de serviços de Wi-Fi a bordo, o propósito da viagem (seja a trabalho ou pessoal), a classe da passagem e a qualidade do entretenimento a bordo como fatores determinantes.
Essas descobertas reforçam a robustez do modelo construído e fornecem insights valiosos para aprimorar ainda mais a precisão e eficácia das previsões. A análise detalhada das variáveis e métricas utilizadas destaca a importância da abordagem metodológica adotada, garantindo resultados confiáveis e relevantes para a tomada de decisões informadas no contexto em questão.
Apresentação

Galeria de imagens


