A influência dos critérios nos resultados estatísticos

Você já ouviu uma declaração do tipo “A família média norte-americana tem 0,90 criança?” O que há de errado com essa declaração, e como podemos consertá-la? Que tal, “Em uma amostra representativa de 20 famílias norte-americanas, pode-se esperar encontrar 18 crianças?” A declaração é prolixa, porém mais precisa. Por que nos preocupamos com isso?

Os estatísticos prestam muita atenção a definições porque sem elas seria impossível fazer cálculos, e a interpretação dos dados não teria nenhum significado. Frequentemente, quando você lê estatísticas relatadas em um jornal, o jornalista ou editor, algumas vezes, opta por descrever os resultados de uma maneira que seja mais fácil compreender, mas que distorce o resultado estatístico real.

Vamos selecionar o nosso exemplo. A palavra média tem um significado muito específico na probabilidade. O significado pretendido da palavra, nesse caso, é, na realidade, típico. O adjetivo norte-americana nos ajuda a definir a população. O Census Bureau define família como “um grupo de duas ou mais pessoas (uma das quais sendo o provedor) relacionados por nascimento, casamento ou adoção, e que residem no mesmo lar; todas essas pessoas (incluindo membros da subfamília correlatos) são consideradas como membros de uma família”. Define crianças como “todas as pessoas com menos de 18 anos de idade, excluindo pessoas que mantenham domicílios, famílias ou subfamílias como uma pessoa de referência ou cônjuge”.

Como compreendemos implicitamente que uma família não pode ter um número fracionado de crianças, aceitamos que essa variável discreta assuma as propriedades de uma variável contínua, quando estamos falando sobre as características de uma grande população. Quão extensa precisa ser uma população, antes que possamos derivar variáveis contínuas a partir de variáveis discretas?

Quando as pessoas ouvem essa estatística, uma reação comum é: “Como isso pode ser verdade? Cada família que tem crianças tem uma ou mais crianças. Como pode a média ser 0,90?” Uma vez mais, é importante reconhecer o que está sendo mensurado. A estatística descrita nos parágrafos anteriores inclui muitas famílias que não têm nenhuma criança, famílias cujas crianças cresceram e se mudaram, e famílias cujas crianças ainda estão vivendo no lar, mas têm pelo menos 18 anos de idade. Todas essas famílias são contadas na média e fazem baixar a média porque, ou não têm crianças ou suas crianças têm 18 anos de idade, ou mais, e, consequentemente, não estão incluídas no cálculo. Observe também, que essa média é para famílias e não para domicílios.

A moral da história é: sempre que você ler um resultado estatístico, certifique-se de que consegue entender as definições dos termos usados para descrever o resultado e relacionar esses termos às definições que você já conhece. Em alguns casos, ano é uma variável categórica, em outras é uma variável discreta, e em outros é uma variável contínua. Muitas pesquisas irão relatar que “os entrevistados se sentem melhor, do mesmo jeito, ou pior” em relação a um determinado assunto. Embora melhor, do mesmo jeito ou pior tenham uma ordem natural inerente, essas respostas não possuem valores numéricos.


Fontes

Mann, Prem S. “Introdução à Estatística”. Texto: Falando a linguagem da estatística.  LTC, 8ª edição, 12 de abril de 2015, 788 p.

Ramos, Raniere. A média não é o bastante. Joinville, 9 de agosto de 2015. Disponível em: https://oestatistico.com.br/2015/08/09/media-nao-e-bastante/. Acesso em: 03 jan. 2016.

Material usado

Imagem da apresentação: http://bit.ly/1OIaO22

Siga-nos nas redes sociais

Facebook: https://www.facebook.com/oestatistico

Twitter: 

Instagram: 

Pinterest: