Lembro-me como se fosse hoje, quando decidi fazer o curso de graduação em Estatística.  Era 1997, e eu estava no 1° ano do ensino médio. Foi quando tive contato com a ciência pela primeira vez. O mundo de possibilidades que eu enxerguei naquela época era imenso. Mas não chega nem perto do que ele representa hoje; não mesmo!

Meus pais de certa forma não me incentivaram, achando que eu estava fazendo a escolha errada. Em contrapartida, ao mesmo tempo não me proibiram de fazer algo que eu acreditava ser importante na minha vida. Imagino como foi difícil ver seu filho escolhendo algo para seu futuro, não sabiam bem o que era. Na verdade, não faziam ideia! É diferente quando se escolhe profissões mais badaladas, como medicina, direito ou administração.

Então eu me formei em Estatística. Trabalhei nas mais variadas áreas do conhecimento como: educação, tecnologia da informação, agronomia, engenharia; e atualmente trabalho na área da saúde. Posso dizer que é muito bom trabalhar nas mais diversas áreas, porque de fato, enriquece o conhecimento e te apresenta novas possibilidades. Aprendi muitas coisas novas, esqueci outras pouco utilizadas e isso faz parte do negócio. Mas há algo intrigante nisso tudo!

Há 5 anos venho acompanhando o comportamento da profissão de estatístico, e como anda o mercado de trabalho brasileiro e no mundo. Fiz isso de forma mais consistente nos últimos 6 meses por causa do site e do meu compromisso com os leitores. Nas minhas pesquisas surgiram questões que acredito serem extremamente importantes para construir o futuro da estatística, como: Quais são as habilidades que o estatístico precisa ter para exercer suas funções? Ser só estatístico é suficiente? Como está acontecendo a evolução do conhecimento? Estamos no caminho certo? O que a Estatística tem a ver com ciência de dados? É preciso análise de dados para trabalhar com big data? Por que o aprendizado de máquina (Machine Learning) e a construção de algoritmos precisam de estatística? O que dizer então da Internet das Coisas (IoT)? Será que você está preparado para isso? Será que você tem participado de forma ativa dessa “revolução do conhecimento”?

Ciência de Dados

A American Statistical Association (ASA) é um dos órgãos mais respeitados do mundo, quando o assunto é estatística. Em 2015, o presidente David Morganstein, fez uma declaração sobre o papel da estatística na ciência de dados:

Através desta declaração, a ASA e seus membros reconhecem que a ciência dados abrange mais do que estatísticas, mas ao mesmo tempo também reconhece que a ciência estatística desempenha um papel fundamental no rápido crescimento deste campo. É nossa esperança que esta declaração possa reforçar a relação de estatísticas para a ciência de dados e ainda fomentar relacionamentos mútuos de colaboração entre todos os contribuintes na ciência de dados”.

Os estatísticos da ASA já reconheceram a importância do conhecimento em análise estatística para a ciência de dados; e que este novo campo, engloba muito mais do que a estatística. Essa é uma das profissões do momento, e que está aparecendo aos poucos no Brasil. Já é possível encontrar vagas com o título Cientista de dados, onde a descrição das habilidades e atribuições se encaixam perfeitamente com o profissional Estatístico, com algum plus, é claro.

Ser um cientista de dados é realizar análises complexas. Eles geralmente trabalham com grandes quantidades de dados; são especialistas em linguagens de programação, utilizam análise estatística para identificar padrões de comportamento; costumam estar bem próximo à área de Tecnologia da Informação; e desenvolvem algoritmos complexos para trabalhar com aprendizagem de máquina.

A boa notícia é que nós também podemos adquirir esse know-how. Na verdade, minha sugestão é que façamos isso. Você precisa fazer de forma gradativa, mesmo porque a quantidade de conteúdo é imensa. O importante é começar. Vá aprendendo ou aprimorando seus conhecimentos em linguagens de programação, como R, Python e Julia; desenvolva as técnicas de analytics; aprenda machine learning. Quer saber como se tornar um Cientista de Dados?

Quais habilidades você já tem?

Quais habilidades você já tem?

Analytics

Não vou generalizar, mas é muito comum eu encontrar amigos formados em estatística, trabalhando em várias áreas do conhecimento, aplicando apenas técnicas de estatística descritiva. Infelizmente eu me incluo neste grupo.

Uma boa parcela das empresas no Brasil, não dedicam tempo suficiente para que sejam desenvolvidos estudos mais avançados dessa ciência fantástica. Preferem “gastar” energia apenas olhando o passado, sem se preocupar por exemplo, com modelos preditivos, inferência e até mesmo métodos de simulação. A realidade é que, em muitos casos, poucas informações relevantes são retiradas das análises dos dados brutos.

Para melhorar esse cenário, uma das possibilidades, é você aprimorar seu analytics. E nesse quesito há dois pontos primordiais: a) O estatístico tem que saber fazer as perguntas certas; b) E a formulação dos testes de hipóteses devem ser despidos de preconceito. Ou seja, duas tarefas nada fáceis.

Essa realidade tende a mudar com o número crescente de profissionais interessados em aprendizagem de máquina. Com esse novo conceito será possível realmente fazer as perguntas certas, e eliminar ou minimizar ao máximo o viés de suas análises. Mas enquanto isso de fato não acontece, você deve mesmo é focar em 4 tipos de Analytics:

  • Análise Descritiva (Descriptive Analytics)
  • Análise de Diagnóstico (Diagnostic Analytics)
  • Análise Preditiva (Predictive Analytics)
  • Análise Prescriptiva (Precriptive Analytics)

A grande maioria trabalha com os 2 primeiros tipos de análises. Análise com base no que já aconteceu, sem inferir nos resultados. Análises realmente básicas, e que em muitos casos você não precisa ser formado em estatística para executar a tarefa.

Mas você pode melhorar seu tipo de análise. Quer saber como você pode fazer isso? Então dá uma olhada na matéria que meu amigo David Matos, do blog Ciência e Dados, escreveu sobre tipos de analytics. Veja o que ele tem a dizer, e coloque em prática.

Big Data

Que o Big Data pode trazer informações reveladoras para uma empresa ou um negócio específico, não temos dúvida. Mas ele também pode causar muita dor de cabeça se os seus dados forem ruins e não estiverem bem organizados. Essa “bagunça” pode se tornar ainda maior porque o big data intensifica e amplifica os resultados, já que estamos falando da análise de um grande volume de dados, certo?

E por que o estatístico deve se preocupar com isso? Porque uma das suas atribuições é realizar a análise de dados.

Relembrar é viver! Há 5 anos atrás, quando entrei na empresa que eu trabalho, analisar os dados não era uma tarefa tão difícil assim. Hoje, tenho a sensação de que o volume de dados deve ter aumentado umas 10 vezes. Isso mesmo! E para analisar essa “massa de dados” tivemos que mudar nossas técnicas e métodos. Nos adaptamos! Criamos novos layouts, mudamos o software de análise, tornamos a equipe mais multidisciplinar.

Como se não bastasse o aumento no volume dos dados, as empresas passaram a ter cada vez mais necessidade de entender seus dados. Cruzar informações em busca de respostas que viabilizem serviços e produtos personalizados; análises que identifiquem melhor custo-benefício para a empresa e o consumidor; prover informações estratégicas que aumentem o poder de competitividade da empresa.

No fundo, elas também tiveram que se adaptar. O fato é que não adianta fugir ou adiar. Embora algumas pessoas acreditem que big data é uma jogada de marketing, ele vem se consolidando gradativamente, e é bem provável que você tenha que se adaptar, como eu tive que fazer. A menos que você queira ficar para trás. Acho que não é o caso, estou certo?

Comece lendo livros sobre o assunto, consumindo conteúdo na internet e trabalhando com bases de dados de diversas fontes, cruzando as informações. Com isso, você já vai conseguir se divertir um pouco.

Aprendizagem de Máquina ou Machine Learning

Agora o negócio começa a ficar no nível hard. Já pensou em “ensinar uma máquina a pensar”? Esse é o conceito de máquinas inteligentes baseada na Inteligência Artificial. Além disso, é um conceito atual, e um dos mais fascinantes dos últimos tempos.

Expressando de forma modesta meu conhecimento sobre o assunto, a aprendizagem de máquina é fundamentada na criação de super algoritmos que tentam imitar o cérebro humano; e com base nisso tomar suas próprias decisões. De preferência as melhores decisões ou o menor dano possível.

O que estamos acompanhando é uma evolução de como alguns dados serão analisados de agora em diante. Principalmente em casos onde as respostas devem ser dadas da forma mais rápida possível, como nos casos de análise na web (redes sociais), ou até mesmo em empresas que utilizam processos automatizados.

Um caso prático é como os carros autônomos da Tesla fazem uso da aprendizagem de máquina. Um exemplo é quando em casos de possíveis acidentes, como uma pessoa atravessando na frente do carro, o algoritmo tem que decidir em frações de segundo, se desacelera, joga o carro na outra pista ou atropela as pessoas. Todas essas decisões são baseadas em algoritmos fundamentados em probabilidade.

Outro caso, é quando o algoritmo utiliza os sensores para identificar as características dos carros ao seu redor, e identificá-los dentro de grupos conhecidos e pré-definidos na aprendizagem de máquina.

carros-tesla-oestatistico

Veja que nos dois exemplos de carros da Tesla, foram usados conceitos de probabilidade e identificação de padrões. Tudo a ver com Estatística, certo? Certo ()!

Além de Ciência de dados, Analytics, Big Data e Aprendizagem de Máquina, ainda tem a Internet das Coisas. Mas esse assunto eu vou falar em outro momento porque senão você vai enlouquecer.

Mas perceba que as mudanças já começaram, e a minha pergunta é: onde é que você quer estar daqui há 5 anos? E que tipo de estatístico você quer ser? Pense nisso com carinho! Seu futuro depende de decisões importantes agora.


Fontes

Iamarino, Átila. (2014, julho 10). Big Data [arquivo de vídeo]. Encontrado em https://www.youtube.com/watch?v=hEFFCKxYbKM

Merigo, Carlos; Dias, Cris; Yassuda, Luiz; Brandão, Adriano (2015, 4, dezembro). Braincast 175 – Prevendo o comportamento do consumidor (podcast). Recuperado de http://bit.ly/2eLV7qp

Mobilon, Thiago; Higa, Paulo; Gonçalves, Matheus (2015, 20, novembro). Tecnocast 033 – Programados para matar (podcast). Recuperado de http://bit.ly/2gsR6sN

Material usado

Imagem de um homem segurando uma bola de cristalhttp://bit.ly/2gfYFm5

Imagem do Modern Data Scientist: http://bit.ly/1tix4mj

Imagem do carro da Tesla utilizando Machine Learning: http://bit.ly/1kuK1Ie

Siga-nos nas redes sociais

Facebook: https://www.facebook.com/oestatistico

Twitter: https://twitter.com/oestatisticoweb

Instagram: https://www.instagram.com/oestatistico

Pinterest: https://br.pinterest.com/estatisticoblog