Você deve estar perguntando: “análise exploratória de dados? Por que vou fazer algo tão simples, se posso trabalhar com algo complexo, como análise de regressão ou análise multivariada; ou quem sabe análise de séries temporais?” Acontece que a análise exploratória ou análise descritiva também é importante no trabalho do estatístico ou de qualquer profissional que trabalhe com dados; e tem o seu valor. Além disso, faz parte das etapas imprescindíveis para uma melhor eficiência das análises estatísticas.
Se você “ainda” precisa ser convencido, vale a pena ler o texto “Faça a análise exploratória dos dados“. Se você fizer um momento de reflexão, vai perceber que a maioria da população tem acesso a esse tipo de informação. Portanto não a ignore!
Quase todos os jornais e revistas, nos dias de hoje, contêm gráficos (e infográficos) e relatos baseados em estudos estatísticos. Basta acessar o site dos jornais Valor Econômico, Estadão e O Globo, e você provavelmente encontrará um gráfico na página inicial.
Mas queremos saber sobre você! Tem praticado análise exploratória de dados? Ou acha que esta etapa pode ser “pulada”? Como partir para uma análise mais arrojada se ainda não conheço os meus dados? É recomendável?
Mas afinal de contas, o que é analisar dados?
É perceptível que ao longo das últimas quatro décadas, a estatística se tornou mais popular do que nunca. Em alguns países, como Estados Unidos e Suécia, a estatística está presente em praticamente tudo. Tudo mesmo. Qualquer assunto é motivo de análise. Descobrir que a Suécia tem o maior número de McDonald’s por pessoa da Europa; ou mesmo, que existe 1 milhão de barcos na Suécia (1 barco a cada 9 pessoas) são informações simples geradas por análise exploratória, e que fazem parte do cotidiano das pessoas que moram nesses países.
Analisar dados nem sempre precisa ser algo complexo e de difícil entendimento. Estamos aqui justamente para falar de uma parte da estatística que não precisa necessariamente de uma fundamentação matemática rigorosa. Vamos falar da parte, onde fazemos tipo uma “sondagem” dos dados. É como se você fosse fazer o primeiro contato com a informação disponível. Olhar tudo de uma forma geral; sem questionar muito. Estamos na fase da observação.
É a fase de “namoro dos dados”. É nessa hora que você identifica os comportamentos médios e discrepantes; compara esses comportamentos; investiga a interdependência entre as variáveis; procura e identifica tendências. É a partir do conjunto de dados inicial, que você aplica os recursos computacionais e define o que de fato é essencial, e o que é lixo. Sim, as bases de dados possuem muito lixo!
De forma análoga, é como se você fosse procurar um(a) pretendente, observasse a pessoa e fizesse uma análise descritiva apontando os detalhes mais marcantes (o que é aceitável ou não para o seu padrão): qual a altura da pessoa, cor dos olhos, tipo de cabelo, cor da pele, alto ou baixo, magro ou gordo; e por aí vai.
É como se você resumisse rapidamente e de forma eficiente, toda a informação contida nos dados (ou no que você está observando). Esse é o início das análises que permitirão você tomar decisões de forma mais consciente e assertiva.
“Em suma, as técnicas da análise exploratória de dados nos ajudam a extrair informações relevantes de um conjunto de dados”
De maneira geral, não abra mão de utilizar as técnicas da análise exploratória. Não economize. Use tudo que for adequado na sua análise. Você pode aplicar, por exemplo:
- Histogramas
- Polígonos
- Ramo-e-folhas
- Box Plot
- Gráficos de simetria
- Diagrama de pontos
A partir daí, você pode encontrar parâmetros para cada uma das variáveis, como média, mediana, moda, percentis, quartis, mínimo, máximo, amplitude, desvio-padrão, variância, coeficiente de variação.
Embora muitos profissionais “desprezem” essas técnicas, acreditamos que elas deveriam fazer parte de toda e qualquer análise que vocês façam. Se você já faz, aprimore. Se não, inclua em seus trabalhos. “Vire os dados do avesso”; olhe por todos os ângulos.
“Sempre há uma nova perspectiva”
E você? Utiliza técnicas de análise exploratória de dados? Qual técnica você mais utiliza?
Deixe nos comentários a sua experiência que em breve faremos posts com cada técnica e suas aplicações mais inusitadas.
Até a próxima pessoal!
Material usado
Imagem do painel com estatísticas descritivas: http://bit.ly/2gUNTEX
Siga-nos nas redes sociais
Facebook: https://www.facebook.com/oestatistico
Twitter:
Instagram:
Pinterest: