O Valor da Distribuição de Frequência

Frequência: qualidade do que é frequente; caráter de algo que acontece muitas vezes; repetição de eventos.

Frequência parece uma daquelas palavras que você e eu conhecemos bastante, certo? Por exemplo, com que frequência você acessa o blog “O Estatístico” por mês? Qual a sua frequência de atividades físicas na semana? Com que frequência você estuda? Com que frequência você assiste filmes no NETFLIX? Com que frequência você acessa as redes sociais diariamente?

Talvez você não saiba as respostas para todas essas perguntas. Eu pelo menos não sei quantas vezes acesso minhas redes sociais. Mas a proposta que eu tenho hoje é outra. Você conhece a frequência dos dados que analisa na empresa, na faculdade, no mestrado, doutorado?

Resolvi levantar esse ponto de reflexão porque recentemente tive contato com trabalhos que me fizeram pensar sobre o assunto. Percebi que alguns trabalhos já apresentavam técnicas de estatística mais avançadas, como testes de hipóteses e análise de regressão. Mas ao perguntar sobre a frequência de um determinado evento, o pesquisador não soube responder, e foi quando descobri que ele não tinha realizado uma distribuição de frequência dos seus dados, sequer uma análise exploratória dos dados.

A distribuição de frequência

Uma distribuição de frequências compreende a organização dos dados de acordo com as ocorrências dos diferentes resultados observados para cada variável. Esses dados podem ser resumidos e visualizados por meio de tabelas e gráficos.

Além disso, a distribuição dos dados pela frequência pode ser feita de dois modos: relativo ou acumulado. A frequência relativa é a apresentação da frequência de valores que aparecem em cada uma das faixas, dividida pela frequência total de valores de um conjunto e geralmente é expressa em porcentagem. A frequência relativa é dada por:

A frequência acumulada é a apresentação das frequências acumuladas que aparecem em cada uma das faixas, dividida pela frequência total de valores de um conjunto. Para exemplificar, eu fiz uma tabela com a quantidade de mamografias realizadas em mulheres no ano de 2013 por estado.

Quantidade de mamografias realizadas em mulheres no ano de 2013 por estado

Apenas com uma tabela simples de distribuição de frequências é possível chegar a algumas conclusões: o estado mais representativo é SP (27,58%) e o menos representativo é RR (0,05%). Os estados de MG, SP, RS, SC e PR foram responsáveis por 63,85% das realizações de mamografia no período. Simples assim!

Então se você quisesse realizar um estudo sobre a qualidade do exame de mamografia para onde você iria? Ou se quisesse entender por que as mulheres da região Norte não realizam os exames, qual estudo você faria? Podemos ainda cruzar esses dados com o IBGE, para saber qual o percentual de mulheres vivendo em cada estado por faixa etária. O estudo pode ser bem mais amplo.

A proposta é você estudar os seus dados antes de partir para uma análise mais elaborada. Tente fazer isso e você pode se surpreender com os resultados.

O valor da distribuição de frequências?

Uma simples análise da distribuição de frequências tem muito valor. Utilize-a!

Quando você descreve os dados e começa a explorá-los, passa a entender um pouco mais a população de onde eles foram extraídos. Este tipo de análise pode ser caracterizado como uma análise exploratória de dados, ou seja, uma tentativa de captar a essência das informações contidas nos dados, através da construção de tabelas e gráficos. Em termos mais técnicos, uma análise exploratória de dados consiste na busca de um padrão ou modelo que possa nos orientar em análises posteriores.

Então é isso! Vamos fazer algumas tabelas de frequências?


Fontes

Portal Brasileiro de dados Abertos. “Quantidade de mamografias realizadas em mulheres no ano de 2013 por estado – dados preliminares. Publicado em dados.gov.br. Disponível em http://dados.gov.br/dataset/mspainelsage_431/resource/db02661b-5860-449b-814a-bc078af0d628?view_id=bedf5803-a493-404c-84af-34701e4069e1

Material usado

Imagem do textohttps://datafloq.com/read/free-business-analytics-content-part-2/1922