A carreira em dados oferece muitas opções e é uma das áreas que possui demanda cada vez mais crescente no mercado de trabalho. Com o avanço de tecnologias cada vez mais rápido, o mundo produz uma quantidade gigantesca de dados a todo instante, e é necessário utilizar essas informações como um guia para solucionar problemas relacionados ao negócio e gerar insights cada vez mais assertivos e que permitam um crescimento da empresa na qual você trabalha.
Porém, esse hype alimentado pela disseminação dessa área de dados causa muita confusão e desinformação, principalmente para quem quer ingressar nesse mundo e, muitas vezes, não sabe nem por onde começar e quais são as possibilidades de carreira para o profissional que deseja trabalhar nesse universo de dados.
Os diferentes cargos da carreira em dados
Dentro da carreira em dados, você pode atuar de maneiras diferentes. Alguns exemplos são:
- Analista de Dados
- Cientista de Dados
- Engenheiro de Dados
- Engenheiro de Machine Learning
Ao decorrer deste artigo, vamos esclarecer algumas principais dúvidas sobre quais são os diferentes cargos e responsabilidades relacionados a área de dados, como se dá a rotina desses profissionais, e quais as habilidades técnicas (hard skills) e comportamentais (soft skills) mais desejadas para ter sucesso desempenhando cada um desses papéis.
1) Analista de Dados / Analista de Business Intelligence (Data Analyst/ Business Analyst)
O que faz?
A principal função de um analista de dados é aglomerar todas as informações disponíveis nos bancos de dados do seu local de trabalho e transformar isso em informações que sejam de alguma forma úteis para o negócio.
Um analista de dados também pode ser chamado de Analista de Negócios ou Analista de Business Intelligence, e, em algumas empresas, ele atua como um “consultor” de negócios gerando insights para áreas como: vendas, marketing, gestão estratégica etc.
Na maioria das vezes, um analista de dados procura respostas para problemas que já são conhecidos pelo negócio, trabalhando com a coleta, processamento e análise estatística dos dados já disponíveis em um determinado banco de dados.
Sendo assim, um Analista de Dados precisa ter um conhecimento muito profundo sobre como funciona o negócio no qual ele está inserido, para que, desta forma, seja possível “fazer as perguntas certas” para tirar informações corretas de dados e métricas disponíveis.
As informações obtidas pelo Analista de Dados são disponibilizadas para os stakeholders e clientes internos através de relatórios e dashboards, trabalhando com storytelling de dados que facilite a tomada de decisão.
Quais as Hard Skills necessárias?
- Linguagem de Programação (Python, R)
- Manipulação de banco de dados (SQL)
- Estatística descritiva (teste de hipótese, correlação entre variáveis)
- Data Visualization (Power BI, Tableau, Google Data Studio, Metabase etc).
Quais as Soft Skills necessárias?
- Oratória, pois um analista de dados sempre realiza a apresentação das análises para outras áreas;
- Proatividade para resolver problemas do negócio que tenham um impacto significativo sem que seja necessária a demanda chegar até você;
- Business sense, ou seja, conhecimento do negócio, para entender muito bem o problema que você está analisando e traduzir as informações de dados na forma de insights para o negócio;
- Boa comunicação escrita, pois parte de um trabalho de analista de dados é a documentação das análises e o storytelling por trás da linha de raciocínio. Para uma boa governança dos dados e de tudo o que está sendo desenvolvido, é necessário uma documentação clara, objetiva e que seja útil para os stakeholders do negócio.
2) Cientista de Dados (Data Scientist)
O que faz?
O campo da ciência de dados tem como principal função encontrar insights a partir de grandes quantidades de dados, que podem estar estruturados ou não. Um cientista de dados se preocupa em encontrar respostas para problemas “ainda desconhecidos” pelo negócio, modelando novos fenômenos e entendendo novos padrões de dados.
São usadas inúmeras técnicas para obter essas informações, como por exemplo: análises preditivas, algoritmos de aprendizado de máquina (ou, como é difundido mundialmente, machine learning) para analisar grandes conjuntos de dados.
Os cientistas de dados procuram possíveis caminhos para se estudar fenômenos que modelam o negócio e as métricas que o influenciam, procurando muito mais do que responder a uma determinada pergunta (como no caso do Analista de Dados), e sim entender quais novas perguntas podem ser feitas para gerar insights, prevendo tendências e estudando padrões, encontrando a melhor maneira de se analisar informações relevantes.
Quando uma empresa decide por contratar um cientista de dados para uma empresa, eles estão focados em desenvolver novos modelos de análise para os principais pontos do negócio, fazendo com que as empresas entendam melhor sobre si mesmas e sobre seus clientes para tomarem melhores decisões.
Em outras palavras, o Cientista de Dados possui as mesmas habilidades de um Analista de Dados, porém com um background estatístico e matemático mais avançado, e com conhecimentos adicionais sobre algoritmos de machine learning para criar novos modelos.
Quais as Hard Skills necessárias?
- Linguagens de Programação (Python, R, Java);
- Manipulação de banco de dados (SQL);
- Estatística;
- Modelos Preditivos;
- Machine Learning;
- Visualização de Dados;
- Desenvolvimento de Software;
- Data Visualization (Power BI, Tableau, Google Data Studio, Metabase etc).
Quais as Soft Skills necessárias?
- Pensamento crítico;
- Comunicação Efetiva;
- Business Sense;
- Negociação;
- Curiosidade;
3) Engenheiro de Dados (Data Engineer)
O que faz?
Um engenheiro de dados é responsável pela criação e pela manutenção de uma infraestrutura que habilita a escalabilidade e a produção de um modelo de dados realizado por um Cientista de Dados. Eles desenvolvem, constroem e mantêm o que chamamos de arquiteturas de banco de dados e sistemas de processamento em larga escala. Em outras palavras, eles garantem que os dados estão disponíveis em larga escala para que o Analista de Dados e o Cientista de Dados consigam trabalhar.
Dentre as responsabilidades de um Engenheiro de Dados, está a projeção e construção desses sistemas de dados, que alimentam o algoritmo de machine learning e as análises de Inteligência Artificial. Eles também desenvolvem processos de informação para um série de tarefas relacionadas a dados, como, por exemplo, a transformação desses dados, a modelagem dos dados etc.
Os engenheiros de dados criam o pipeline de dados que irão conectar os dados de um sistema para outro, transformando dados de um formato para outro, caso seja necessário, para que o Cientista de Dados puxar esses dados de diferentes sistemas para análises distintas.
Quais as Hard Skills necessárias?
- Linguagens de Programação (Python, R);
- Bancos de dados (SQL, noSQL, MongoDB, Hive, Hadoop etc);
- Serviços Cloud;
- Integrações e APIs.
Quais as Soft Skills necessárias?
- Adaptabilidade;
- Comunicação Efetiva;
- Oratória;
- Escrita Expositiva;
- Gestão de Tempo;
- Trabalho em Equipe.
4) Engenheiro de Machine Learning (Machine Learning Engineer)
O que faz?
O Engenheiro de Machine Learning realiza um trabalho análogo ao de um programador ou desenvolvedor, porém com um foco muito além de especificamente programar máquinas para performar algumas atividades: eles criam programas que permitem que as máquinas tomem ações sem necessariamente serem direcionadas para tal.
É o Engenheiro de Machine Learning que faz a ponte entre a construção do modelo de teste com algoritmos de machine learning e sua produção em larga escala. Em outras palavras, um cientista de dados pode até produzir um modelo que seja avançado o suficiente para resolver um problema do negócio, porém até que esses modelos estejam prontamente disponíveis para o público-alvo, eles estão de certa forma “escondidos” atrás de uma barreira que requer um certo nível de habilidade técnica para ser ultrapassada.
Desta forma, um Engenheiro de Machine Learning utiliza seus conhecimentos de algoritmos de aprendizagem de máquina com suas skills de programação e engenharia de software para facilitar o acesso a modelos e análises.
A rotina de um Engenheiro de Machine Learning se resume a:
- Explorar, organizar e limpar dados e encontrar padrões e atributos que podem ser usados para construir modelos de machine learning;
- Aprimorar pipelines e data lakes, garantindo que os dados estejam limpos e otimizados para modelos de machine learning;
- Melhorar a produtividade da equipe ao criar estruturas e bibliotecas que auxiliam cientistas e analistas de dados a construir modelos melhores e analisar dados com mais facilidade;
- Ajustar modelos em produção periodicamente.
Quais as Hard Skills necessárias?
- Linguagens de Programação (Python, R, Java);
- Manipulação de banco de dados (SQL);
- Estatística;
- Aplicação avançada de algoritmos de Machine Learning;
- Engenharia de Software;
- Design de Sistemas.
Quais as Soft Skills necessárias?
- Liderança;
- Comunicação Efetiva;
- Trabalho em equipe;
- Ética no trabalho;
- Gerenciamento de equipe.
O profissional de dados
São muitas opções para quem quer seguir essa carreira na área de dados, porém, independentemente de qual papel você quer desempenhar, existem algumas habilidades que são imprescindíveis para você não ser apenas “mais um profissional de dados”, mas sim O PROFISSIONAL DE DADOS:
1 – Construção de um Portfólio de Projetos
Ficar só na teoria não vai te fazer um bom profissional de dados. É preciso aplicar esse conhecimento que você está aprendendo para resolver problemas reais do negócio e exercitar a sua capacidade analítica e seu business sense. Se você entende sobre os frameworks de projeto para data science, você consegue organizar melhor seu fluxo de trabalho e entregar análises que sejam realmente importantes para o crescimento de uma empresa.
Existem muitos datasets (conjuntos de dados reais) dentro da internet que possibilita a você exercitar seus conhecimentos e criar “cases” para ser um bom profissional de dados. Em uma entrevista de emprego, quem possui um portfólio robusto de projetos de dados é visto com um olhar diferenciado por contratantes.
2 – Entendimento sobre o negócio
Talvez a habilidade mais difícil a ser conquistada pelo profissional de dados seja no seu “business sense”, entender como diferentes negócios operam e o real impacto de métricas e indicadores para a dinâmica do mercado.
Esse tipo de habilidade você não constrói apenas lendo livros e estudando a teoria, mas sim praticando tudo o que você aprendeu em um ambiente que te proporcione, para que você tenha um portfólio diferenciado de projetos que realmente resolvam problemas do negócio.
É a parte mais complexa de toda a parte de dados e é assim que vamos separar os profissionais “bons” dos “excelentes”. Entender sobre modelos de negócio, marketing, vendas, OKRs pode te passar na frente de muitos concorrentes para uma vaga na área de dados.
Quer saber mais sobre a área de dados?
Torne-se um cientista de dados aprendendo tudo na prática! Elabore modelos estatísticos, criar algoritmos, solucionar problemas e ampliar estratégia de negócios, desenvolvendo habilidades como:
- Python Fundamentals
- Machine Learning
- SQL for Data Science
- Visualização de dados
- Metodologias Ágeis
- Big Data
- Estatística
- Manipulação e limpeza de dados