Ciência de Dados: Uma Breve História

Vivemos na era da informação e da (des)informação com o aumento das fake news. O fato é que de uma forma ou de outra, o mundo nunca gerou tanta informação como atualmente; e você e eu fazemos parte disso.

A informação é gerada a partir de dados. Dados produzidos por cada um dos seres humanos no planeta (e animais rastreados), por máquinas, sistemas, celulares, satélites, dispositivos e mais recentemente a Internet das Coisas (IoT); com estimativa de 43 bilhões de devices conectados até 2023, segundo estudo da McKinsey.

A ciência de dados nos traz ferramentas, métodos e tecnologias para analisar, visualizar e tomar decisões baseada em dados. E pelo que vimos, estamos em uma era de abundância com tendências de crescimento exponencial.

Para você ter uma ideia, olha o quanto de dados geramos a cada minuto nas principais plataformas e aplicativos, como Instagram, NETFLIX, YouTube, Google e Twitter.

Qual a importância da ciência de dados?

Imagine a quantidade de dados gerados a cada dia por uma empresa. Pedidos, vendas, pagamentos, relacionamentos com os outros clientes, processos internos, auditorias, contabilidade, finanças, marketing, bancos de dados, e-mails, sistemas, redes sociais, RH.

Como estes dados se relacionam? E como se relacionam com o mundo externo à empresa? Como tomar melhores decisões baseada em dados? E como fazer isso com dados gerados em tempo real?

Isso não se aplica apenas ao mundo corporativo. Se uma empresa quer fornecer serviços e produtos de forma mais personalizada para um possível cliente, ela tem que conhecer a jornada diária do cliente ou de um grupo semelhante de clientes.

Por exemplo: vamos analisar quanto de dados eu gero em um dia aleatório na minha rotina: monitoramento do sono, passeio com cachorro (registrado pelo Google), planejamento de projetos no Trello, e-mails, Uber, metrô (registrado pela passagem na catraca), bike (app Bike Itaú), supermercado (app sodexo), pagamentos e transferências em bancos digitais, academia (app da academia), corrida (app Nike Run Club), Instagram, Twitter, WordPress, WhatsApp, Apple Music, iFood, Amazon (app), e por aí vai. Tenho uma vida bem digital.

Agora vamos pensar um pouquinho. Como fazer para conectar todos esses pontos? Para oferecer o serviço ou produto com a maior probabilidade de compra?

Esse é um dos desafios que a ciência de dados está ajudando a resolver. É claro que isso envolve muita estatística.

Por que a ciência de dados está crescendo?

A ciência de dados cresce na mesma velocidade com que os dados são gerados. Como já conversamos, você percebeu que a quantidade de dados gerados tende ao infinito.

Por isso, contamos com novos métodos, tecnologias e processos para extrair informação valiosa contida nessa imensidão de dados. E a ciência de dados tem o desafio de ajudar aqueles que precisam responder as perguntas que ainda não foram feitas.

Praticamos ciência de dados o tempo todo

Estima-se que no futuro, todos serão cientistas de dados. Na prática, já somos. Recebemos toneladas de dados todos os dias, das mais variadas fontes e formatos. E cada um de nós decide o que fazer com esses dados e como transformá-los em informação útil. Você acredita?

Aplicativo do tempo para ajudar você a decidir se leva ou não o guarda-chuva; Waze ajudando a escolher o melhor caminho; você escolhendo o próximo filme baseado nas sugestões do seu streaming; optando por usar o aplicativo de transporte mais barato, após comparar Uber, 99, Cabify, Taxi Rio; e selecionando informações para gerar uma lista de música para seu pet.

Fonte: https://pets.byspotify.com/

“Não tem jeito! Nossa vida já é baseada em dados”.

Precisamos apenas aprender as melhores técnicas para fazer com que os dados nos ajudem a tomar as melhores decisões.

Quem é o cientista de dados?

O cientista de dados é o profissional responsável por aplicar técnicas, modelos, tecnologias e processos para extrair informação relevante dos dados. Tudo isso com muita estatística e programação aplicada.

Quando você acessa um site de compras e recebe ofertas de produtos baseados no seu gosto, algum cientista de dados aplicou conhecimentos para criar um sistema que avaliasse suas preferências (sistemas de recomendação) de acordo com os cliques que você efetuou no site.

Você já deve ter reparado isso, quando a Amazon começa a sugerir produtos; aquela companhia aérea manda umas promoções via e-mail e o app de comida fica mandando uns descontos para você sair da sua alimentação equilibrada.

O que faz um cientista de dados?

O cientista de dados é responsável por extrair grandes volumes de dados de múltiplas fontes internas e externas, empregar tecnologias sofisticadas de análise, aprendizado de máquina e métodos estatísticos para preparar os dados para uso em modelagem preditiva e prescritiva, além de explorar e analisar dados em várias perspectivas, a fim de determinar fraquezas escondidas, tendências e oportunidades de um negócio.

No final, você pode até não ser um estatístico ou um cientista de dados, mas com certeza já utiliza o raciocínio lógico para tomar suas decisões.