Qui-quadrado

Portal de Saúde Pública

Investigação e Estatística
2.2 Associação Entre Duas Variáveis Qualitativas

Teste Qui-Quadrado e Teste Exacto de Fisher

Suponhamos que temos uma amostra de 5 pessoas, para as quais sabemos o sexo e a idade. O sexo é uma variável nominal, enquanto a idade poderá ser quantitativa, caso façamos a sua medição em "anos". No entanto, neste caso vamos transformá-la numa variável também nominal, criando duas classes - a classe dos adultos e a dos jovens.

Nestes casos, assim como em qualquer caso onde tenhamos duas variáveis qualitativas em jogo, poderemos expor os dados segundo uma tabela de dupla entrada. Tendo em conta o exemplo já criado no EpiInfo, poderemos criar esta tabela através da execução do comando TABLES, em que pomos Sexo como variável de exposição e Grupos etários (ex: Jovens com menos de 18 anos e Adultos) como variável resposta:

		Variável "output" (Grupos)
		Adultos	Jovens	Total
Variável de exposição (Sexo)	Homem	3	0	3
	Mulher	1	1	2
	Total	4	1	5

Também na secção STATCALC é possível construir tabelas mas, neste caso, directamente do teclado, e não a partir de uma base de dados já existente.

Seja como for, face aos dados da tabela exemplificada em cima, pode-se perguntar se o grupo de "Adultos" é diferente do grupo de "Jovens" quanto ao sexo.

Vamos supor que na verdade não existe uma diferença entre os dois grupos quanto ao sexo na população de onde vem esta amostra. Novamente, mesmo que seja esta a verdade, é também possível que quando colhemos uma amostra o resultado possa apresentar uma diferença por questões ligadas ao acaso.

É claro que quanto maior for a dimensão da amostra, mais fácil será identificar diferenças verdadeiras entre os dois grupos. Também, quanto maior for a diferença no género sexual entre os dois grupos, mais provável será a existência desta diferença verdadeira entre os dois grupos.

O Qui-quadrado mede a probabilidade de as diferenças encontradas nos dois grupos da nossa amostra serem devidas ao acaso, partindo do pressuposto que, na verdade, não há diferenças entre os dois grupos na população donde provêm. Se a probabilidade for alta poderemos concluir que não há diferenças estatisticamente significativas. Se a probabilidade for baixa (particularmente menor que 5%) poderemos concluir que o grupo de "Adultos" é diferente do grupo de "Jovens" quanto ao sexo, e de forma estatisticamente significativa.

No entanto, o Qui-quadrado tem limitações, nomeadamente, deverá ser substituído pela Prova exacta de Fisher quando os valores esperados nas células da tabela são inferiores a 5.

Assim, eu recomendo que se verifique sempre se somos avisados - "Warning: the expected value of a cell is < 5. Fisher Exact Test should be used". Nestes casos, evidentemente utilizaremos o "p" unilateral de Fisher ("1-tailed P-value"). Quando não recebemos este aviso poderemos utilizar o valor "p" do Qui-quadrado não corrigido.

No caso do nosso exemplo o valor "p" do Qui-quadrado seria 0,17 mas o valor a utilizar deveria ser o de Fisher, ou seja 0,40 (o que significaria que as eventuais diferenças não seriam estatisticamente significativas).

Índice

Parte 1 - metodologia básica da investigação

1º Identificação do assunto a investigar

2º Identificação das variáveis do estudo

3º Identificação da população e amostra do estudo

4º Definição do desenho do estudo

5º Planeamento da recolha e análise dos dados

6º Interpretação dos resultados (e elaboração do relatório)

Parte 2 - noções de estatística

1. Estatística descritiva

2. Estatística dedutiva

2.1 Intervalos de confiança

2.2 Testes Qui-quadrado e Fisher

2.3 Testes de Student / ANOVA e de Mann-Whitney / Kruskal-Wallis

3. Força da associação

3.1 Estudos de coorte

3.2 Estudos de caso-controlo

Anexo 1 - Revisão bibliográfica

Anexo 2 - Controlo das variáveis interferentes

Anexo 3 - Cálculo da dimensão da amostra

Bibliografia

Quando a tabela tem mais de duas filas e/ou colunas o Qui-quadrado continua a ser aplicável, mas a Prova de Fisher não (só o é para tabelas de 2x2), pelo que o seu resultado nunca aparece. O comando TABLES produz a tabela e calcula o Qui-quadrado mas, quando a tabela é superior a 2x2, não nos avisa quando os valores esperados nas células são inferiores a 5.

Só a secção STATCALC nos dá tais avisos pelo que eu recomendo sempre reproduzir estas tabelas, com mais de duas filas ou colunas, nesta secção. Deverá ser aceite o valor de "p" proposto excepto quando somos avisados que o valor esperado de uma célula é inferior a 5. Nestes casos, como já não podemos utilizar a Prova de Fisher, resta-nos agregar a tabela de forma a conter menos colunas ou filas, e voltar a aplicar o Qui-quadrado.

Também na secção STATCALC existe a possibilidade muito interessante de se fazer a prova da tendência linear do Qui-quadrado.

Suponhamos que temos uma tabela do género:

		Doenças cardíacas (Variável resultado)
		Sim (casos)	Não (controlos)
Consumo de tabaco (Variável exposição)	1 (não fuma)	5	85
	2 (1-15 cigarros/dia)	6	54
	3 (>15 cigarros/dia)	9	41

Fonte: Massons JMD. Métodos estadísticos en ciencias de la salud, UD 10 - Barcelona, 11ª Ed, ISBN: 84-8049-189-2, 1999.

Neste caso, temos uma variável de exposição ordenada e uma variável resultado dicotómica. Se, fizermos o Qui-quadrado obteremos o seguinte resultado: p=0,0629 .

Este resultado diz-nos que não há diferenças estatisticamente significativas (para um nível de significância convencionado de 0,05) entre os doentes e não doentes quanto ao seu consumo de tabaco, mas não tem em conta o efeito crescente da variável exposição.

Se entrarmos em conta com este efeito, não só tornamos mais potente o teste como poderemos verificar existir uma relação linear entre as duas variáveis. É o que faz a Prova da tendência linear do Qui-quadrado cujo “p”, neste caso, é igual a 0,0206. Ou seja, há uma relação linear estatisticamente significativa entre o nível de consumo de tabaco e a existência de doença cardíaca.

Esta Prova da tendência linear só poderá ser aplicada quando a variável resposta seja dicotómica e a variável exposição seja quantitativa ou ordinal (variável de categorias ordenadas em três ou mais níveis).

Também só poderá ser aplicada depois de verificarmos que não há valores esperados nas células inferiores a 5. Isto não é automaticamente verificado pelo EpiInfo enquanto se faz a prova da tendência linear: ter-se-á sempre que aplicar o Qui-quadrado convencional na secção STATCALC, da forma já referida.