O poder e o perigo do Teste de Hipóteses

Os testes de hipóteses encontram-se entre as ferramentas mais poderosas e perigosas na estatística. Eles nos permitem realizar afirmativas em relação a uma população e atribuir um grau de incerteza a essas afirmativas.

Pegue um jornal e folheie todo ele; raro será o dia em que o jornal não contenha uma matéria apresentando um resultado estatístico, frequentemente descrito com um nível de significância. Considerando que as matérias dessas reportagens – saúde pública, meio ambiente e assim por diante – são importantes para nossas vidas, é crucial que realizemos apropriadamente cálculos estatísticos e as interpretações. A primeira etapa, aquela que você deve procurar quando estiver lendo os resultados estatísticos, é a especificação/formulação apropriada.

Formulação ou especificação, colocando de maneira simples, representa a lista de etapas que você deve percorrer ao construir um teste de hipóteses. As etapas do teste de hipóteses são:

  1. Declarar a hipótese nula e a hipótese alternativa;
  2. Selecionar a distribuição apropriada;
  3. Determinar a região de rejeição e a região de não rejeição.

Uma vez que essas etapas tenham sido percorridas, tudo o que você precisa fazer é calcular o p-valor ou a estatística do teste no intuito de completar o teste de hipóteses. É importante permanecer atento em relação às armadilhas inerentes à especificação.

Embora possa parecer óbvio, declarar apropriadamente as hipóteses pode ser difícil. Para hipóteses em torno da média aritmética de uma população, a hipótese nula e a hipótese alternativa são afirmações matemáticas que não se sobrepõem e, também, não apresentam lacunas.

Suponha que um confeiteiro afirme que suas barras de chocolate possuem, em média, uma massa correspondente a 100 gramas. A hipótese nula é de que a massa das barras é igual a 100 gamas, e a hipótese alternativa é que a massa das barras não é igual a 100 gramas. Quando você extrai uma amostra de barras de chocolate e mede suas respectivas massas, todas as possibilidades para a média aritmética da amostra irão se posicionar dentro de uma de suas regiões de decisão. O problema é um pouco mais difícil para hipóteses baseadas em proporções. Certifique-se de ter somente duas categorias. Por exemplo, se você está tentando determinar a percentagem da população que tenha cabelos louros, os seus grupos serão “louro” e “não louros”.

Por fim, tenha cautela para com a precisão numérica. Quando sua amostra for grande e você presumir que tenha uma distribuição normal, a região de rejeição para um teste bicaudal, utilizando a distribuição normal, com um nível de significância de 5%, corresponderá aos valores de média aritmética da amostra que estarão mais distantes do que 1,96 unidade de desvio-padrão em relação à média aritmética presumida. Quando você estiver realizando os seus cálculos, a média aritmética da amostra poderá vir a se posicionar na fronteira de sua região de rejeição.

Lembre-se que existe o erro de mediação e o erro de amostragem, em relação aos quais você consegue ter uma dimensão precisa. Neste caso, é provavelmente mais recomendável ajustar o seu nível de significância de maneira tal que a média aritmética da amostra venha a se posicionar integralmente em uma determinada região de decisão.


Fontes

Mann, Prem S. “Introdução à Estatística”. LTC, 8ª edição, 12 de abril de 2015, 788 p.

Material usado

Imagem do Teste de Hipóteses: http://bit.ly/1RjXhOy

Siga-nos nas redes sociais

Facebook: https://www.facebook.com/oestatistico

Twitter: 

Instagram: 

Pinterest: