Projeto de Data Science do Zero

Tenho que confessar: sou fã de carteirinha do trabalho que o Téo Calvo desenvolve toda semana nas redes sociais. Além de suas postagens no Linkedin e no Instagram, destaco especialmente as lives realizadas todas as quintas-feiras às 20:00 (exceto quando ocorre maratona, que geralmente é realizada de sexta para sábado), onde ele ensina programação em Python, manipulação de bancos de dados SQL e NoSQL, Git e muitas outras ferramentas.

Os eventos que o Téo realiza já fazem parte da minha agenda e deixo de participar apenas se tenho um compromisso inadiável. Já aprendi muito durante as lives; participei de maratonas e até ganhei um livro de Python. Você acredita?

science

Mas na real, eu estou aqui para falar sobre a live que fizemos esse final de semana. Diferente das anteriores, o Téo resolveu que era hora de dar mais um passo adiante. Ao invés de apresentar as ferramentas de tecnologia e falar sobre estatística, decidiu executar um projeto de Data Science do zero. Uma chance de mostrar de fato como acontece na prática.

Com esse pensamento, selecionou um conjunto de dados público sobre o comércio eletrônico brasileiro de pedidos feitos pela loja Olist. Esse conjunto possuía informações de 100 mil pedidos realizados entre 2016 e 2018 por vários mercados no Brasil, com dados sobre status do pedido, preço, pagamento, frete, localização do cliente e outros; tudo disponível no Kaggle.

Com a matéria-prima em mãos, um projeto de data science foi colocado em desenvolvimento. Debatemos muito sobre os problemas de negócio; realizamos ETLs; manipulamos os dados na AWS e no SQLite; usamos o Python no ambiente do Visual Studio Code.

Pretendíamos ajustar um modelo preditivo e mostrar como entregar informação de valor para a empresa. Mas na vida real, nem tudo acontece como planejamentos, certo?

Tivemos problemas para configurar o ambiente de trabalho e conectar com o banco de dados da Amazon; investimos um tempo para discutir o negócio; bebemos cerveja para dar uma relaxada durante a live, mas estávamos cansados demais para continuar madrugada adentro.

Então retomamos nosso projeto no sábado às 20:00. Foram muitos desenhos explicativos, testes A/B e um bate papo de alto nível com a presença de João Paulo Nogueira. Sim, meus amigos! Téo, João e eu fizemos uma live (quase podcast) com muitas histórias sobre as nossas experiências profissionais e pessoais. Me diverti muito!

A experiência do final de semana foi tão sensacional que seria egoísmo da minha parte se eu não dividisse com você. Para que você possa aproveitar e adquirir mais conhecimento, o Téo disponibilizou a live no canal dele no YouTube.

Corre lá no canal e confere nossas discussões sobre os perfis de clientes e como eles podem ser impactados por campanhas de vendas. Aproveita, se inscreve no canal e ativa as notificações que ainda vem muita coisa boa por aí!

Ah, aproveita segue o Téo no Github e fica atento nas sugestões de livros sobre estatística, modelagem, programação, bancos de dados, projetos e ferramentas úteis para quem trabalha com análise de dados.