Olá, tudo bem com você? Como eu havia prometido, vamos falar mais sobre o que os estatísticos fazem. Ontem comentamos sobre como definir o problema e escolher um conjunto de dados ideal. Se você não leu, dá uma “olhadinha” na matéria, assim você pega a sequência. Vamos lá?
Porque a partir de agora, o trabalho começa a ficar com cara de estatística mesmo. Mais interessante sabe. É aquela etapa que todo estudante de graduação espera ansiosamente porque já está um pouco cansado de ver apenas matemática. E fica pensando: “quando é que vamos aprender estatística de verdade?”
Então agora, vamos começar a colocar a “mão na massa” e pensar como estatísticos.
E são mais 3 etapas:
– Como obter os dados?
– Como limpar, filtrar, “higienizar” seus dados (passar a peneira)? Tirar todo o “lixo”.
– Explorar os dados e ter uma visão geral. O que eles querem dizer?
1. Obtenha os dados
A qualidade das suas análises está diretamente ligada com a qualidade dos seus dados. Por isso é tão importante definir o problema antes, para só depois obter os dados. A partir daí, acontece o planejamento da coleta de dados. Vamos trabalhar com amostras ou a população? Vamos trabalhar com dados qualitativos ou quantitativos? Ou ambos?
A obtenção de dados pode ocorrer de muitas maneiras. Você pode aplicar questionários, realizar entrevistas, observar acontecimentos e registrar, analisar conteúdo; e o mais comum, em épocas de Big Data, é acessar bases de dados. Praticamente qualquer empresa possui uma infinidade delas. Não importa se vai obter via papel ou computador. O que é importante é a qualidade e se vão responder o seu problema.
Exemplos: “Entrevistar ouvintes de uma rádio para determinar qual o melhor horário para anunciar um produto específico”; “Medir a quantidade de milímetros de água da chuva em uma região”; “Obter dados registrados de um campeonato de futebol, como passes errados, chutes a gol, cabeçadas, laterais, cruzamentos, e por aí vai”.
2. Limpe os dados
Agora começa a compreensão dos dados. Isso mesmo! Procure por valores perdidos, confira o formato das variáveis, transforme de nominal para numérico (se necessário), discretize os dados, verifique se há discrepâncias nas codificações ou nomes, identifique outliers, reduza dados. Vire a sua base de dados do avesso.
Acredite! Tudo isso é necessário porque “os dados do mundo real estão sujos”. “Sem dados de boa qualidade, o nosso trabalho fica comprometido”.
Exemplos: “Padronize datas como AAAAMM”; “Converta binário para numérico, como por exemplo, os sexos masculino (M) e feminino (F) para 0 e 1”; “Converta ordinal para numérico: como por exemplo, o grau de satisfação de um produto, que pode ser muito satisfeito, convertido para 0.8”.
3. Faça a análise exploratória dos dados
A finalidade dessa etapa é examinar previamente seus dados. Então faça uma boa análise descritiva. Organize e sintetize seus dados de forma a obter as informações necessárias. E utilize as técnicas gráficas, sempre prezando pela clareza, simplicidade e auto explicação.
Faça o “dever de casa” e analise máximo, mínimo, moda, média, mediana, quartis, amplitude, intervalo-interquartil, variância, desvio padrão, coeficiente de variação, tabelas de frequência. Everything!
Depois analise “visualmente”: gráfico de barras, gráfico de setores, histograma, boxplot, gráfico de linha (sequência), polígono de frequências, diagrama de dispersão.
Exemplos: “Analise a frequência de pessoas em caixas eletrônicos nos dias de pagamento”; “Represente o nível de satisfação de um produto pelo gráfico de setores”; “Entenda a temperatura de uma cidade ao longo do dia pelo diagrama de dispersão”.
Agora tudo ficou um pouco mais interessante, não acha?
Por mais simples que pareçam essas etapas, elas são fundamentais para o sucesso do seu trabalho. Então divirta-se.
Material usado
Imagem de um homem apontando para o gráfico: http://bit.ly/2dhQrHj
Siga-nos nas redes sociais
Facebook: https://www.facebook.com/oestatistico
Twitter:
Instagram:
Pinterest: