R Markdown, você conhece? Se você já teve a oportunidade de analisar dados utilizando a linguagem R, é bem possível que conheça ou pelo menos tenha ouvido falar de longe.
O R Markdown é um formato de arquivo que permite a criação de documentos dinâmicos utilizando R. Estes documentos são gravados em markdown (um formato de texto simples e fácil de escrever) e contém pedaços de código R incorporado. Os documentos podem ser criados em HTML, PDF, Word, websites, dashboards e apresentações estilo Beamer.
Agora, você pode estar se perguntando: “Por que diabos eu vou querer documentar o código? Basta escrever o script e está tudo certo rsrs”.
O negócio é o seguinte: o R Markdown permite que você gere um relatório automaticamente a partir de um arquivo gravado no RStudio. Os documentos gerados podem servir como um registro puro de sua análise que pode ser compartilhado e publicado em um relatório detalhado e completo.
Mesmo que você nunca espere apresentar os resultados a outra pessoa, ele também pode ser usado como um caderno pessoal para olhar para trás, para que você possa ver o que fez naquele momento. Um caderno, entendeu? Só que escrito por digitação.
“Agora pensa comigo: e se você não fosse o criador do documento?”
Imagina que você acabou de entrar para um time de analistas de dados em uma nova empresa e tem a missão de melhorar o código de um profissional que foi alocado em outro projeto. Ao invés de receber apenas o script ou o caminho para diversas pastas no GitHub, não seria melhor receber uma documentação com códigos, entradas, saídas, comentários e gráficos?
O R Markdown é uma excelente ferramenta para unir tudo isso e fazer seus dados contarem uma história. A ferramenta transforma suas análises em documentos, relatórios e apresentações em painéis de alta qualidade. É informação disponível de forma elegante que vai “encher os olhos” de quem vê.
Se apenas isso não fosse o bastante, o R Markdown pode combinar três partes importantes de qualquer análise estatística.
- O código R para mostrar como as análises foram feitas. Por exemplo, os dados e as funções que você usou. Isso permite que os leitores sigam seu código e verifiquem se as análises foram realizadas corretamente.
- Resultados do código, ou seja, a saída de suas análises. Por exemplo, a saída do seu modelo linear, plotagens ou resultados do teste de hipótese que você acabou de codificar. Isso permite que os leitores vejam os resultados de suas análises.
- Texto, comentários e interpretações dos resultados. Por exemplo, depois de calcular as principais estatísticas descritivas e plotar alguns gráficos, você pode interpretá-las no contexto do seu problema e destacar descobertas importantes. Isso permite que os leitores entendam seus resultados graças às suas interpretações e comentários, entregues como se você tivesse escrito um documento explicando seu trabalho.
Outra vantagem do R Markdown é que os relatórios são dinâmicos e reproduzíveis por qualquer pessoa que tenha acesso ao arquivo. Rmd (e aos dados se forem utilizados dados externos, é claro), tornando-o perfeitamente adequado para colaboração e disseminação de resultados.
Por dinâmica, queremos dizer que, se seus dados forem alterados, seus resultados e suas interpretações mudarão de acordo, sem nenhum trabalho do seu lado.
Eu não sei você, mas eu só vejo vantagens.
Eu já tive a oportunidade de participar de projetos grandiosos em análise de dados, dentro de um ambiente incubadora de startups, onde foram realizadas muitas análises sem nenhuma documentação. Em ambientes inovadores é comum a troca de profissionais com uma maior frequência e se o trabalho não estiver organizado e documentado, existe uma grande probabilidade do conhecimento sumir.
Nesta experiência que citei, a empresa que eu trabalhava e a startup acabaram por resolver o caso na justiça, pois o trabalho realizado não podia ser reproduzido (estava em contrato), uma vez que não havia documentação.
“Eu acredito que tudo na vida é hábito. Então se você cultivar esse, seu trabalho analisando dados tende a melhorar.”