Por que a carreira de cientista de dados é tão promissora no Brasil

Udacity Brasil
27 de fev de 2018

Há pouco tempo, saber como usar Big Data era a grande tendência para empresas. Hoje em dia, a situação é mais pragmática: a maioria delas tem tantos dados disponíveis que o principal desafio não é ser um early adopter, mas transformar essa informação em conhecimento.

É aí que entra o cientista de dados, um profissional que deve se tornar cada vez mais necessário para empresas que querem se destacar no mercado.

Essa demanda por profissionais deve vir acompanhada de salários interessantes no Brasil. Já há empresas com cientistas de dados em folhas de pagamento ganhando mais de R$ 25 mil por mês – e mesmo os salários de profissionais mais no começo da carreira são bem atraentes.

Quer ser tornar um cientista de dados? Conheça a trilha de carreira da Udacity

Na plataforma de trabalho LoveMondays, cientistas de dados que aceitaram divulgar seus salários têm um salário bruto médio de 10 mil reais. O guia salarial da empresa de recrutamento e seleção Robert Half divulga faixas entre 5.300 reais (para um cargo júnior) e 18 mil reais (para um especialista).

Ainda de acordo com a Robert Half, a perspectiva é que cresçam entre 13 e 15% ao longo de 2018, com acréscimos de 8% para profissionais que sabem programar em Python e outros 8% para programação em R.

Segundo a empresa, esta é uma das áreas mais promissoras do setor de tecnologia de informação.

Mas o que, afinal, cientistas de dados são capazes de fazer por uma organização e que benefícios essa carreira pode trazer, além da remuneração?

Leia: Big Data e Machine Learning: saiba como usar essas tecnologias no varejo

A resposta está na ciência de dados

Há 5 meses, Jéssica Santos trabalha como cientista de dados plena na no Grupo Zap Viva Real, que gerencia projetos como o site Zap Imóveis. Em seu dia a dia, ela recebe projetos relacionados a negócios e conversa com os envolvidos para entender como os dados que a empresa tem podem ajudar naquele projeto.

O próximo passo é obter os dados necessários e “tratá-los”, ou seja, torná-los adequados para que eles possam ser trabalhados por computadores. Quando todos os dados estão na mão, é possível criar modelos para oferecer a melhor orientação ao projeto de negócios.

São várias versões, que vão sendo testadas ao longo de semanas até que uma delas se revele a mais precisa. Nesse ponto, o projeto se encaminha para o final e uma nova questão pode ser colocada à equipe.

Que tipos de projetos são esses? As possibilidades são inúmeras.

Pode ser, por exemplo, um sistema que dá uma “nota” a um usuário conforme sua probabilidade de pagar o aluguel em dia. Pode ser também um sistema de recomendação parecido com o da Netflix, que saiba indicar para usuário, com base nos imóveis que ele já viu, outros dos quais provavelmente vai gostar.

“O objetivo de um data scientist é utilizar também dados do presente e do passado, mas para criar modelos que possam prever comportamentos futuros”, esclarece Jéssica.

O cientista de dados, segundo ela, ainda é responsável por extrair informações a partir de dados não estruturados, como imagens e textos.

São formatos com os quais computadores ainda não sabem trabalhar tão bem, e extrair esses dados exige alguns conhecimentos específicos de ciência de computação.

Se você precisar ensinar as máquinas a identificar objetos contidos em fotos, por exemplo, precisará de uma técnica chamada visão computacional, que usa alguns conhecimentos de machine learning.

Há também uma área chamada de Natural Language Processing (processamento de linguagem natural) que ajuda as máquinas a extraírem informações e “interpretar”, até certo ponto, os textos aos quais têm acesso.

Esse processo facilita imensamente o trabalho: não é preciso que alguém avalie todos os documentos escaneados que são enviados para o site. Computadores conseguem realizar a tarefa e esses dados já chegam em um formato estruturado, pronto para ser usado por um cientista de dados.

Na prática, é graças a essas tecnologias que um site também pode avaliar se uma foto do seu imóvel está boa, escura ou clara demais, por exemplo.

BAIXE O EBOOK: Guia Completo Para Começar Sua Carreira em Data Science

O que cientistas de dados precisam saber

Tornar esses dados inteligíveis para uma máquina e criar um modelo que permita “prever o futuro” com eles exige uma série de trabalhos diferentes.

André Costa, que trabalha na área de Business Analytics da Gympass – e fez diversos Nanodegree da Udacity, entre eles Data Science para Negócios, Introdução à Programação e Engenheiro de Machine Learning –, explica que o processo de ir dos dados até uma resposta exige etapas variadas.

Um único cientista de dados pode ficar encarregado apenas do tratamento dos dados que serão usados no modelo final para garantir que todos esses dados sejam inteligíveis para as máquinas que terão de processá-los.

Pode também nem se envolver com essa parte, dedicando-se apenas à criação do modelo encarregado de processar os dados. Ou ainda ser responsável só pela criação de uma “pipeline” de captação de dados: um sistema que gere dados inteligíveis a partir das interações dos usuários com um site ou aplicativo.

Mais uma vez, pense no caso da Netflix. Só ao estar no site assistindo algo, você gera esses dados – mas só porque alguém programou-o para funcionar assim.

Leia: Como a análise de dados na Netflix construiu o sucesso da empresa?

Em termos de conhecimentos específicos, André ressalta que a estatística é a área de estudo mais importante para quem deseja ingressar nessa área. “Você vai precisa demonstrar causalidade usando dados, e é a estatística que vai te dar as ferramentas para isso”, diz.

Em programação, ele ecoa o conselho da Robert Half: é essencial ter um bom conhecimento das linguagens mais usadas para essas aplicações, como Python e R.

E tanto André quanto Jéssica destacam uma habilidade que é vital para quem quer ser cientista de dados: a comunicação.

De acordo com ela, espera-se que um cientista de dados seja capaz de “entender o objetivo do projeto e sua adequação ao negócio” e que ele consiga “mostrar o desenvolvimento do projeto e discutir as soluções numa linguagem clara e objetiva” – por isso é tão importante que ele consiga se comunicar com clareza.

“Por mais técnico que você seja, se não conseguir fazer essa parte da comunicação, vai sempre precisar de ajuda”, confirma André.

É algo que se torna ainda mais importante porque a profissão é relativamente nova, continua, e as empresas ainda estão começando a perceber tudo que os profissionais dessa área são capazes de trazer.

Leia: Conheça as 10 melhores ferramentas para visualização de dados

Os desafios de uma nova profissão

Com relação às condições de trabalho, os profissionais cadastrados na LoveMondays deram uma nota média de 4 (entre 0 e 5) para sua satisfação geral. A nota só ficou alguns décimos abaixo disso em dois quesitos: cultura da empresa e qualidade de vida.

Ambas podem estar relacionadas aos obstáculos que surgem em uma área que ainda está se estabelecendo, dizem os profissionais. Segundo Jéssica, as empresas "ainda se confundem com o que é ciência de dados”.

É uma curva de aprendizado para todas as partes, mas que esbarra em outros problemas no país. Há organizações que buscam apenas profissionais que já têm experiência no mercado – o que deixa quem ingressa em desvantagem – ou oferecem postos em que as responsabilidades não estão claramente explicadas.

André completa que essa falta de clareza pode resultar, às vezes, em demandas excessivas e incompatíveis. Como empregadores ainda não sabem ao certo o que esperar, fala, acabam jogando sobre a mesa tarefas muito diferentes.

Ainda assim, ele afirma que o setor deve se tornar cada vez mais importante no Brasil e vale o investimento.

“No futuro, essa será a grande profissão porque o mundo está gerando cada vez mais dados", considera. "E como os negócios estão cada vez mais competitivos, é importante que haja alguém capaz de dar um destino a isso."

Leia: Data Science: quais as opções de atuação na área?