26 de out de 2018

O perfil de quem trabalha com data science no Santander

Udacity Brasil

Se os primeiros funcionários do Santander vissem como funcionam as operações atualmente, ia ser um choque e tanto. Afinal, o banco foi fundado em 1857, época em que transações eram registradas em cadernos na ponta do lápis – e não poderia ficar mais diferente.

Sentada ao redor de uma mesa na Vila Olímpia, bairro de São Paulo, num prédio de mais de vinte andares inteiramente dedicado à instituição, parte da equipe de data science do banco conversou com a Udacity sobre a importância dos dados nos dias de hoje.

Ulisses Guimarães, que ocupa o cargo de Chief Data Officer no país, dá uma ideia do crescimento envolvido: entre o fim de 2017 e setembro de 2018, a quantidade de big data do Santander aumentou 80%. Embora não possa divulgar a quantidade, ele dá uma ideia do que se trata: “Imagine a Wikipedia em inglês. É mais de 100 vezes o tamanho dela”. Em 2015, todos os artigos, com arquivos multimídia, somavam mais de 23TB.

Entre os exemplos práticos de data science no Santander, ele cita o fit entre diferentes ofertas e clientes, sugestão de investimentos em tempo real no app de acordo com comportamento histórico da conta, modelagens para concessão de crédito e detecção de fraudes – coisas com as quais rapidamente nos acostumamos, mas que não existem há tanto tempo.

Assista ao webinar: A importância da transformação digital nas empresas

Os principais profissionais de data science

Grace Hung, economista que fez carreira no banco e hoje é gerente de riscos, coloca as transformações sob outra perspectiva. "Hoje eu não quero dar crédito, quero dar uma solução. É [caso de] entender o cliente, não só olhar seu CPF. É algo que só é possível com o processamento de dados, que permite entender cliente a cliente."

Quem já pesquisou um pouco sobre o trabalho com data science sabe que a quantidade de dados em si não é mais importante que a qualidade dos dados e dos insights extraídos. Para tanto, é preciso ter as ferramentas e profissionais adequados – e eles andam raros no mercado, pelo menos no formato “pacote completo” de um cientista de dados.

“Alguém que saiba tanto de programação quanto dados, estatística e negócios é um unicórnio”, brinca Rodrigo Maruyama, superintendente de modelagem e ciência de dados. “Falta também conhecimento do sistema bancário brasileiro, visto que conhecer o negócio faz toda a diferença."

Ele separa as principais demandas da área em duas: o engenheiro de dados, que garante a qualidade, acessibilidade e limpeza dos dados, e o cientista de dados, que aplica estatística em cima dos dados para responder perguntas específicas e extrair valor deles.

O grupo gosta da analogia da cozinha: o chef (no caso, o data scientist) utiliza os ingredientes preparados por outros (no caso, engenheiros de dados) para criar seu prato, mas sem uma preparação bem feita, o resultado não é o mesmo. O bom trabalho de um depende do bom trabalho de outro.

Leia também: Data science e Nubank: por que esta fintech investe tanto em cientistas de dados

Perfil generalista

E do mesmo jeito que quem trabalha com gastronomia começa pela base, o mesmo se aplica aos profissionais de data science: entender como pensar os dados, ao invés de entender apenas como utilizar uma dada ferramenta, significa se preparar para as novidades que inevitavelmente aparecem.

“As ferramentas mudam, mas saber como a arquitetura funciona faz diferença”, resume Grace. (Entre elas, no Santander vale destacar Hadoop, Python, R, Flume e Spark.) “Antes a gente buscava uma skill [específica]. Hoje buscamos uma visão holística de tudo. É alguém que sabe que o modelo precisa ser adaptado, não só que aplica a matemática pura”, continua.

Em sua opinião, o traço que une todas as pontas do profissional de data science buscado pelo mercado hoje é simplesmente a curiosidade. Ulisses concorda. “É alguém que pensa fora da caixa, coloca as coisas para testar e rodar.” Para Rodrigo, isso se traduz numa mentalidade de melhoria contínua: “Na hora que você cria o melhor modelo, já pensa no que dá para melhorar”.

Aprendizado contínuo

É por isso que os três apostam no aprendizado contínuo, cada um à sua maneira. Grace prefere o método estruturado de cursos (online e offline), Rodrigo consome montanhas de ebooks e Ulisses, que recentemente fez um curso sobre o IBM Watson e outro sobre big data em Harvard, busca papers interessantes. “Há um mundo de coisas grátis na internet”, sugere.

Esse novo meio de educar pessoas para uma profissão também nova tem criado uma diversidade interna de destaque na área de data science do banco, que inclui físicos, economistas, engenheiros e designers, entre outros backgrounds.

Ou seja, não importa exatamente o que você fez antes, apenas o que aprendeu sobre data e como aplicou esse aprendizado – e quais são suas respostas nas complexas entrevistas técnicas. ”É na entrevista que tento entender a história [do candidato], suas grandes experiências e realizações”, fala Grace.

“O espírito de busca e a experiência são cada vez mais valorizados”, complementa Ulisses. “Seja curioso, porque isso é fundamental. Se você está achando que está bom… Não está bom."

Saiba mais sobre data science:

Sobre o autor
Udacity Brasil

A Udacity, conhecida como a "Universidade do Vale do Silício", é uma plataforma online e global que conecta educação e mercado para ensinar as habilidades do futuro – de data science e marketing digital à inteligência artificial e desenvolvimento. Hoje, há mais de 7 mil alunos ativos no país e 50 mil pelo mundo.