Descubra como um sistema de recomendação de bairros em Porto Alegre pode facilitar suas viagens de trabalho. Conheça as etapas de coleta e preparação dos dados, os modelos de recomendação testados e os resultados obtidos.

O Projeto de Recomendação de Bairros em Porto Alegre

Este projeto foi desenvolvido com o objetivo de criar um sistema de recomendação de bairros em Porto Alegre, visando auxiliar os leitores a escolherem onde se hospedar durante suas viagens para a cidade.

  • O projeto visa oferecer recomendações de bairros em Porto Alegre, com base em preferências similares do autor em São Paulo.
  • O sistema busca identificar bairros em Porto Alegre que possuam características semelhantes aos bairros favoritos do autor em São Paulo.
  • O objetivo principal é fornecer informações úteis para auxiliar na escolha de hospedagem durante viagens de trabalho para Porto Alegre.

Coleta de Dados para Recomendação de Bairros

Para o desenvolvimento do sistema de recomendação, foram utilizadas diversas fontes de dados, a fim de fornecer informações relevantes sobre os bairros de Porto Alegre.

  • Foram coletadas informações sobre a distância de cada bairro até o local de trabalho do autor, visando recomendar bairros mais próximos do local de trabalho em Porto Alegre.
  • Utilizou-se a API do Foursquare para coletar dados sobre os tipos e a quantidade de estabelecimentos em cada bairro, tais como bares, restaurantes e parques.
  • Informações sobre características demográficas e socioeconômicas dos bairros, como população, renda e IDH, foram obtidas no site Atlas Brasil.

Coleta de Dados e Preparação

Os dados dos bairros foram obtidos via API do serviço Geolib, permitindo o cálculo de distâncias. Além disso, as preferências do usuário foram pontuadas manualmente para incorporar na recomendação.

  • Utilização da API Geolib para obter dados dos bairros e calcular distâncias
  • Incorporação das preferências do usuário na recomendação através da pontuação manual

Pré-Processamento dos Dados

Após a coleta, diversos pré-processamentos foram realizados, incluindo a atualização dos dados de IDH e características dos bairros, cálculo da distância entre cada bairro e o local de trabalho, normalização da população por faixas etárias relevantes, remoção de bairros muito distantes do trabalho e a agregação e consolidação dos dados de diferentes fontes em um único dataframe.

  • Atualização dos dados de IDH e características dos bairros
  • Cálculo da distância entre cada bairro e o local de trabalho
  • Normalização da população por faixas etárias relevantes
  • Remoção de bairros muito distantes do trabalho
  • Agregação e consolidação dos dados de diferentes fontes em um único dataframe

Modelos de Recomendação

Foram testados dois algoritmos de recomendação: o Recomendador do Scikit-Learn, um modelo colaborativo baseado no dataframe construído, e o K-Means, que realizou o agrupamento dos bairros em clusters para identificar similaridades. Ambos os modelos obtiveram resultados muito similares, recomendando basicamente os mesmos bairros no topo da lista, o que deu mais confiança na recomendação.

  • Teste de dois algoritmos de recomendação: Recomendador do Scikit-Learn e K-Means
  • Resultados similares obtidos pelos dois modelos, aumentando a confiança na recomendação

Pontos de Melhoria no Sistema de Recomendação

Durante a revisão do processo, foram identificados alguns pontos que poderiam ser melhorados:

  • Consumo desnecessário de algumas APIs durante a execução do pipeline (deveriam ser dados estáticos)
  • Falta de documentação sobre a origem ou manipulação de alguns dados
  • Possibilidade de utilização de APIs de mapas para calcular distâncias por rotas reais e não em linha reta
  • Ausência de métricas quantitativas para avaliação dos modelos de recomendação
  • Código com trechos comentados ou desnecessários, dificultando o entendimento do pipeline

Decisão de Deployment do Sistema

Porém, como o sistema já estava funcionando e atendendo à necessidade original, decidiu-se fazer o deployment sem melhorias adicionais.

Validação do Sistema de Recomendação

O sistema de recomendação, apesar de simples, foi capaz de indicar bairros relevantes e adequados para que o autor se hospedasse em suas viagens a Porto Alegre.

  • Os bairros recomendados se mostraram boas opções após visitá-los, validando o resultado do projeto

Expansão do Sistema de Recomendação

Como próximos passos, o sistema poderia ser expandido para trabalhar com mais cidades além de Porto Alegre, se tornando um serviço genérico de recomendação de bairros.

Conclusão

O sistema de recomendação provou ser eficaz ao indicar bairros relevantes e adequados para hospedagem em Porto Alegre. Com a possibilidade de expansão para outras cidades, o sistema tem potencial para se tornar um serviço genérico de recomendação de bairros, atendendo a diversas necessidades de viagem.