Se você me acompanha já deve saber que estou a algumas semanas, para ser mais exato a 4 semanas, trabalhando com estatística e tecnologia na área de varejo online. Para mim é um mundo novo e fiquei espantado quando eu vi a quantidade de dados que empresas de e-commerce possuem sobre tudo: clientes, marcas, sellers, concorrentes, finanças, logística e por aí vai.
Para dar conta da missão, tive que voltar a estudar a linguagem R, mas dessa vez com ênfase para ciência de dados. Trabalho com big data direto e quanto mais conhecimento eu tiver para trabalhar com grandes conjuntos de dados e melhorar a performance dos meus scripts, melhor será!
A maioria das vezes que eu decidi aprender a programar uma linguagem, eu recorri a fóruns, blogs, sites, amigos e colegas de trabalho. Fui aprendendo de uma forma desestruturada e talvez por isso, meu conhecimento em algumas linguagens possuam lacunas de aprendizado, como pude constatar recentemente com a linguagem SQL.
Então em março de 2020, resolvi começar a estudar linguagens de programação de uma forma mais estruturada. Meu ponto de start foi a maratona de Python que eu participei e logo na sequência a minha necessidade de melhorar os meus scripts em SQL.
Para focar no aprendizado, eu conto com esses dois livros:
Minha próxima aquisição seria um livro de R aplicado a ciência de dados. Estava quase certo que eu compraria o livro “R para Ciência de Dados (R for Data Science)” do e . O que estava segurando um pouco a minha compra era o valor do livro, que gira em torno de R$ 200,00.
Foi então que nas minhas buscas pela internet afora, eu achei um link para o livro em formato digital. O livro foi disponibilizado pelos próprios autores e você o encontra acessando o botão abaixo.
O livro usa o R para transformar dados brutos em insights, informações e conhecimento. Toda a abordagem é realizada no RStudio e tem o foco no pacote tidyverse; que é uma coleção de pacotes R projetados para trabalhar juntos para tornar a ciência de dados rápida, fluente e divertida. Além disso, ele é totalmente adequado para profissionais sem experiência prévia em programação.
Você será guiado por etapas que vão evoluindo conforme seu aprendizado avança. São etapas de importação de dados, manipulação, análise exploratória, modelagem de dados e comunicação de resultados.
Este livro será meu guia pelos próximos dois meses. Vamos juntos aprender R com ênfase em ciência de dados. O que está esperando?