CATEGORIA

Dados

Data Science

Manipulação de Dados em larga escala com PySpark

Descubra como o PySpark, uma biblioteca Python para processamento de dados em larga escala, pode ser utilizado para manipular grandes conjuntos de dados de forma rápida e eficiente por meio de operações paralelizadas em clusters computacionais. Aprenda a lidar com valores nulos, realizar agrupamentos e agregações, e explore o processo de preparação e análise de dados com PySpark.

Leia mais »
Data Science

CRISP-DM: Fase avaliação e sua importância

Descubra a importância da fase de Avaliação no CRISP-DM para garantir que projetos de data science estejam alinhados com os objetivos de negócio. Entenda as tarefas chave e entregáveis dessa etapa crucial para o sucesso de projetos de mineração de dados.

Leia mais »
Data Science

ADASYN: como melhorar o desempenho de modelos

Descubra como o ADASYN (Adaptive Synthetic Sampling) pode melhorar o desempenho de modelos em conjuntos de dados desbalanceados, equilibrando as classes de interesse e destacando os exemplos mais desafiadores para o modelo. Leia mais sobre esta técnica eficiente e flexível para balanceamento de classes.

Leia mais »