R Markdown: Por que Usar?

R Markdown, você conhece? Se você já teve a oportunidade de analisar dados utilizando a linguagem R, é bem possível que conheça ou pelo menos tenha ouvido falar de longe.

O R Markdown é um formato de arquivo que permite a criação de documentos dinâmicos utilizando R. Estes documentos são gravados em markdown (um formato de texto simples e fácil de escrever) e contém pedaços de código R incorporado. Os documentos podem ser criados em HTML, PDF, Word, websites, dashboards e apresentações estilo Beamer.

Agora, você pode estar se perguntando: “Por que diabos eu vou querer documentar o código? Basta escrever o script e está tudo certo rsrs”.

O negócio é o seguinte: o R Markdown permite que você gere um relatório automaticamente a partir de um arquivo gravado no RStudio. Os documentos gerados podem servir como um registro puro de sua análise que pode ser compartilhado e publicado em um relatório detalhado e completo.

Mesmo que você nunca espere apresentar os resultados a outra pessoa, ele também pode ser usado como um caderno pessoal para olhar para trás, para que você possa ver o que fez naquele momento. Um caderno, entendeu? Só que escrito por digitação.

“Agora pensa comigo: e se você não fosse o criador do documento?”

Imagina que você acabou de entrar para um time de analistas de dados em uma nova empresa e tem a missão de melhorar o código de um profissional que foi alocado em outro projeto. Ao invés de receber apenas o script ou o caminho para diversas pastas no GitHub, não seria melhor receber uma documentação com códigos, entradas, saídas, comentários e gráficos?

O R Markdown é uma excelente ferramenta para unir tudo isso e fazer seus dados contarem uma história. A ferramenta transforma suas análises em documentos, relatórios e apresentações em painéis de alta qualidade. É informação disponível de forma elegante que vai “encher os olhos” de quem vê.

Se apenas isso não fosse o bastante, o R Markdown pode combinar três partes importantes de qualquer análise estatística.

  1. O código R para mostrar como as análises foram feitas. Por exemplo, os dados e as funções que você usou. Isso permite que os leitores sigam seu código e verifiquem se as análises foram realizadas corretamente.
  2. Resultados do código, ou seja, a saída de suas análises. Por exemplo, a saída do seu modelo linear, plotagens ou resultados do teste de hipótese que você acabou de codificar. Isso permite que os leitores vejam os resultados de suas análises.
  3. Texto, comentários e interpretações dos resultados. Por exemplo, depois de calcular as principais estatísticas descritivas e plotar alguns gráficos, você pode interpretá-las no contexto do seu problema e destacar descobertas importantes. Isso permite que os leitores entendam seus resultados graças às suas interpretações e comentários, entregues como se você tivesse escrito um documento explicando seu trabalho.

Outra vantagem do R Markdown é que os relatórios são dinâmicos e reproduzíveis por qualquer pessoa que tenha acesso ao arquivo. Rmd (e aos dados se forem utilizados dados externos, é claro), tornando-o perfeitamente adequado para colaboração e disseminação de resultados.

Por dinâmica, queremos dizer que, se seus dados forem alterados, seus resultados e suas interpretações mudarão de acordo, sem nenhum trabalho do seu lado.

Eu não sei você, mas eu só vejo vantagens.

Eu já tive a oportunidade de participar de projetos grandiosos em análise de dados, dentro de um ambiente incubadora de startups, onde foram realizadas muitas análises sem nenhuma documentação. Em ambientes inovadores é comum a troca de profissionais com uma maior frequência e se o trabalho não estiver organizado e documentado, existe uma grande probabilidade do conhecimento sumir.

Nesta experiência que citei, a empresa que eu trabalhava e a startup acabaram por resolver o caso na justiça, pois o trabalho realizado não podia ser reproduzido (estava em contrato), uma vez que não havia documentação.

“Eu acredito que tudo na vida é hábito. Então se você cultivar esse, seu trabalho analisando dados tende a melhorar.”