Portal de Saúde Pública

Investigação e Estatística

Anexo 2 Introdução ao Controlo de Variáveis Interferentes

Download do manual

Como controlar o efeito de confundimento das variáveis interferentes?

a) Em primeiro lugar será necessário um bom enquadramento teórico do modelo de causalidade para detectarmos tais confundimentos através de uma boa revisão bibliográfica do problema.

b) Após esta revisão é importante listar todas as variáveis interferentes que eventualmente poderão levar a confundimento.

c) Infelizmente, mesmo com uma boa revisão bibliográfica não temos a garantia de conhecer todas as variáveis interferentes pelo que apenas os estudos experimentais dão garantias de controlo de todas estas variáveis, atendendo compararem grupos que são formados de forma aleatória (única forma de garantir com muita fiabilidade que os grupos são idênticos relativamente a terceiras variáveis interferentes desconhecidas).

d) Nos outros estudos de observação analíticos existem vários métodos estatisticos para controlar estas variáveis (pelo menos as conhecidas...), nomeadamente através do emparelhamento, da padronização, ou da análise estratificada e multivariada.

É importante ter a noção da existência dos dois tipos de variáveis interferentes: as variáveis de confundimento (que produzem confundimento) e as variáveis modificadoras de efeito (que produzem interacção). Enquanto as primeiras traduzem um desajustamento na comparabilidade dos grupos produzindo a confusão, as segundas fazem parte do modelo causal, ou seja, são também uma variável de exposição que modifica a variável resposta, mesmo quando os grupos estão ajustados.

 Figura 1 - Exemplo de confundimento

Variável Exposição (casamento)  Þ  Variável Resultado (cancro)

Ý                             Ý

Variável de Confundimento (idade)

Um exemplo de confundimento clássico é quando fazemos a comparação entre dois grupos - casados/ não casados - e verificamos que o grupo dos casados tem mais cancro (Figura 1). A conclusão errada poderia ser que o casamento provoca o cancro! Mas o problema aqui foi o facto de o grupo dos casados ser mais idoso que o dos solteiros! Ou seja, os dois grupos estavam desajustados quanto à idade pelo que a sua comparação feita desta forma "crua" levava à confusão! Realça-se que as variáveis de confundimento (ex.: a idade) estão sempre associadas tanto às variáveis de exposição (ex.: estado civil) como às variáveis resultado (ex.: cancro).

Figura 2 - Exemplo de interacção

Variável Exposição (idade)  Þ  Variável Resultado (cancro)

                              Ý

Variável Modificadora de Efeito (tabagismo)

Um exemplo de interacção de uma variável interferente modificadora de efeito é quando ao estudarmos a associação entre a idade (v. de exposição) e o cancro (v. resposta), verificamos que o hábito de fumar (v. modificadora do efeito) também produz cancro (Figura 2). Repare-se que, neste caso, a v. "hábito de fumar" também modifica a possibilidade de ter cancro, mesmo que os dois grupos (fumadores/não fumadores) estejam ajustados quanto à idade. Da mesma forma, a idade modifica a possibilidade de ter cancro, mesmo que os dois grupos (novos ou idosos) tenham exactamente os mesmos hábitos tabágicos. Ou seja, neste caso não há confundimento: existe é duas variáveis – tabaco e idade - que têm efeitos próprios e independentes na variável resultado (cancro).

Índice

Parte 1 - metodologia básica da investigação

1º  Identificação do assunto a investigar

2º  Identificação das variáveis do estudo

3º  Identificação da população e amostra do estudo

4º  Definição do desenho do estudo

5º  Planeamento da recolha e análise dos dados

6º  Interpretação dos resultados (e elaboração do relatório)

Parte 2 - noções de estatística

1. Estatística descritiva

2. Estatística dedutiva

2.1  Intervalos de confiança

2.2  Testes Qui-quadrado e Fisher

2.3  Testes de Student / ANOVA e de Mann-Whitney / Kruskal-Wallis

3. Força da associação

3.1  Estudos de coorte

3.2  Estudos de caso-controlo

Anexo 1 - Revisão bibliográfica

Anexo 2 - Controlo das variáveis interferentes

Anexo 3 - Cálculo da dimensão da amostra

Bibliografia

Com as variáveis modificadoras de efeito há um somatório ou uma subtracção do efeito, sendo por isso variáveis que pertencem ao modelo causal, enquanto as variáveis de confundimento puras são apenas vieses.

Para complicar mais um pouco, é possível haver ainda v. interferentes que são simultaneamente de confundimento e modificadoras de efeito. Basta que no estudo anterior, em que verificamos a associação entre idade e cancro, a v. modificadora de efeito "hábito de fumar" esteja também desajustada nos dois grupos etários (velhos/jovens).

Na prática, para verificar se há confundimento, bastará ver se há associação entre a v. interferente e a v. resposta e, se há concomitantemente, desajustamento na variável de exposição entre os dois grupos (expostos/ não expostos) quanto à v. interferente. Para verificar se há interacção bastará verificar se a força da associação entre as variáveis de exposição e de resultado (eventualmente medida através do Risco Relativo ou Odds Ratio) é diferente nos diversos estratos da variável interferente.

O EpiInfo ajuda-nos a controlar o efeito destas variáveis interferentes através do cálculo dos Riscos Relativos ou Odds Ratios no comando TABLES ou na secção STATCALC. Efectivamente podemos calcular estas medidas ajustadas e não ajustadas e, através da sua comparação, verificar o tipo de interferência que existe.

Vejamos algumas situações concretas:

1- Exemplo de Inexistência de Confundimento e Interacção:

 No estudo em que verificamos a associação entre a idade e o cancro, temos uma variável interferente que denominamos "hábito de fumar".

No primeiro quadro em a), expõe-se a totalidade dos dados, com estratificação de acordo com a variável interferente, no segundo em b), expõem-se os dados totais sem estratificação e, nos terceiro e quarto quadro em c) e d), expõem-se os dados para cada estrato da v. interferente:

 a) Amostra total com estratificação para a variável interferente:

V. Exposição

V. Interferente

Doença (Cancro)

Fumadores em cada

grupo etário

Doença +

Doença -

Exposição Positiva

(Idade >45 anos)

Fumador

12

188

40%

Não Fumador

18

282

Exposição Negativa

(Idade <45 anos)

Fumador

  8

192

40%

Não Fumador

12

288

b) Amostra total (sem estratificação):

 Risco Relativo=1,5

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

30

470

Negativa (<45 anos)

20

480

c) Estrato de não fumadores:

 Risco Relativo=1,5

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

18

282

Negativa (<45 anos)

12

288

d) Estrato de fumadores:

 Risco Relativo=1,5

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

12

188

Negativa (<45 anos)

  8

192

Ou seja, neste caso, o Risco Relativo é rigorosamente igual em qualquer estrato, o que comprova que a v. hábito de fumar não modifica o efeito na v. cancro. Também a proporção de fumadores tanto num grupo etário como no outro é idêntica (em ambos os grupos etários existe uma proporção de fumadores semelhante de 40%), o que significa não haver desajuste ou confundimento.

Repare-se que, se pedirmos ao EpiInfo (através da secção STATCALC) que calcule um sumário destes dados para os dois estratos temos os seguintes dados:

RR não ajustado (Crude RR) = RR ajustado (Mantel-Haenszel Weighted RR) = 1,5

Quando o RR não ajustado é igual ao ajustado, não há confundimento.

Quando o RR é igual em cada estrato, não há interacção ou modificação do efeito.

  2- Exemplo de Confundimento Sem Interacção:

a) Amostra total com estratificação para a variável interferente:

V. Exposição

V. Interferente

Doença (Cancro)

Fumadores em cada

grupo etário

Doença +

Doença -

Exposição Positiva

(Idade >45 anos)

Fumador

194

606

80%

Não Fumador

    6

194

Exposição Negativa

(Idade <45 anos)

Fumador

  24

  76

10%

Não Fumador

  26

874

b) Amostra total (não estratificada):

 Risco Relativo=4

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

200

800

Negativa (<45 anos)

  50

950

c) Estrato de não fumadores:

 Risco Relativo=1

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

 6

194

Negativa (<45 anos)

26

874

d) Estrato de fumadores:

 Risco Relativo=1

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

194

606

Negativa (<45 anos)

  24

  76

Ou seja, neste caso, o Risco Relativo é rigorosamente igual em qualquer estrato, o que comprova que a v. hábito de fumar não modifica o efeito na v. cancro. No entanto, a proporção de fumadores é diferente nos dois grupos etários (há 80% de fumadores no grupo com mais de 45 anos, e apenas 10% no grupo com menos de 45 anos) e isto provoca confundimento na associação entre a idade e o cancro.

Repare-se que, se pedirmos ao EpiInfo (através da secção STATCALC) que calcule um sumário destes dados para os dois estratos temos os seguintes dados:

RR não ajustado (Crude RR) = 4 ≠ RR ajustado (Mantel-Haenszel Weighted RR) = 1

Quando o RR ajustado é diferente do não ajustado existe confundimento e, neste caso, deveremos referir apenas o RR ajustado como medida de força da associação.

Quando o RR é igual em cada estrato, não há interacção ou modificação do efeito.

 3- Exemplo de Interacção Sem Confundimento:

 a) Amostra total com estratificação para a variável interferente:

V. Exposição

V. Interferente

Doença (Cancro)

Fumadores em cada

grupo etário

Doença +

Doença -

Exposição Positiva

(Idade >45 anos)

Fumador

42

258

60%

Não Fumador

  4

196

Exposição Negativa

(Idade <45 anos)

Fumador

  8

292

60%

Não Fumador

  2

198

b) Amostra total (não estratificada):

 Risco Relativo=4,6

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

46

454

Negativa (<45 anos)

10

490

c) Estrato de não fumadores:

 Risco Relativo=2

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

4

196

Negativa (<45 anos)

2

198

d) Estrato de fumadores:

 Risco Relativo=5,2

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

42

258

Negativa (<45 anos)

  8

292

Ou seja, neste caso o Risco Relativo dos dois estratos é diferente, o que significa que o hábito de fumar interage com a associação idade - cancro. No entanto, não existe confundimento porque não existe desajuste: a proporção de fumadores é igual entre os dois grupos etários (em ambos é de 60%).

Repare-se que, se pedirmos ao EpiInfo (através da secção STATCALC) que calcule um sumário destes dados para os dois estratos temos os seguintes dados:

RR não ajustado (Crude RR) = RR ajustado (Mantel-Haenszel Weighted RR) = 4,6

Quando o RR não ajustado é igual ao ajustado, não há confundimento.

Quando o RR é diferente em cada estrato, há interacção ou modificação do efeito, como é o caso.

No entanto, havendo interacção, comprovada pela diferença na força de associação entre os diversos estratos, deveremos sempre verificar adicionalmente se estas diferenças são estatisticamente significativas, através da prova de Mantel-Haenszel Summary Chi-squared proposta no EpiInfo, em que o "p", neste caso, é de 0,0000017, ou seja, é estatisticamente significativo.

Quando há interacção como neste exemplo, não poderemos referir apenas um RR para traduzir a relação entre as duas variáveis. Nestes casos deveremos referir o resultado RR para cada estrato, atendendo o risco ser efectivamente diferente em cada estrato.

4- Exemplo de Confundimento e Interacção simultâneos:

 a) Amostra total com estratificação para a variável interferente:

V. Exposição

V. Interferente

Doença (Cancro)

Fumadores em cada

grupo etário

Doença +

Doença -

Exposição Positiva

(Idade >45 anos)

Fumador

12

188

20%

Não Fumador

188

612

Exposição Negativa

(Idade <45 anos)

Fumador

48

752

80%

Não Fumador

  2

198

b) Amostra total (não estratificada):

 Risco Relativo=4

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

200

800

Negativa (<45 anos)

  50

950

c) Estrato de não fumadores:

 Risco Relativo=23,5

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

188

612

Negativa (<45 anos)

2

198

d) Estrato de fumadores:

 Risco Relativo=1

Doença (Cancro)

Doença +

Doença -

Exposição (Idade)

Positiva (>45 anos)

12

188

Negativa (<45 anos)

48

752

Ou seja, neste caso o Risco Relativo dos dois estratos é diferente, o que representa haver interacção. Por outro lado também existe desajustamento entre os dois grupos etários quanto à v. hábito de fumar (o grupo com maios de 45 anos tem 20% de fumadores, enquanto o grupo com menos de 45 anos tem 80% de fumadores).

Claro que se pedirmos ao EpiInfo (através da secção STATCALC) que calcule um sumário destes dados, verificamos a existência de confundimento porque o RR não ajustado (Crude RR) = 4 ≠  RR ajustado (Mantel-Haenszel Weighted RR) = 4,2.

Quando o RR não ajustado é diferente do ajustado, há confundimento.

Quando o RR é diferente em cada estrato, há interacção ou modificação do efeito, como é o caso.

Repete-se que a interacção só deverá ser valorizada quando estatisticamente significativa, comprovada pelo resultado da prova de Mantel-Haenszel Summary Chi-squared (o "p", neste caso, é de 0,00000, ou seja, é estatisticamente significativo).

O confundimento terá que ser valorizado apenas de acordo com o nosso juízo clínico, porque não há uma prova objectiva, tal como a significância estatistica da interacção. Neste caso, embora seja um facto que existe confundimento, comprovado pela diferença entre o RR ajustado e não ajustado, a verdade é que essa diferença é relativamente pequena (de 4 a 4,2), pelo que provavelmente o mais correcto seria não a valorizar.

 Posto isto qual será a melhor estratégia para identificar as variáveis de confundimento e as variáveis modificadoras do efeito? Proponho o seguinte procedimento: 

Já aqui foi referida a necessidade de fazer um bom enquadramento teórico do qual resulte uma listagem das possíveis variáveis interferentes.

Durante a análise bivariada dever-se-á verificar a possibilidade de alteração de associações após a estratificação segundo possíveis v. interferentes.

Se há diferenças de RR entre os estratos, existe interacção (que só deve ser valorizada quando é estatisticamente significativa). Nestes casos, nos resultados deveremos apresentar os RR de cada estrato, não sendo compreensível um RR global.

Se há diferença entre o RR ajustado e não ajustado, existe confundimento e deverá sempre ser apresentado o RR ajustado, como medida da força de associação entre a variável de exposição e de resultado (eliminando o efeito da variável de confundimento).

Se há diferenças estatisticamente significativas de RR entre os estratos, e entre o RR ajustado e não ajustado, existe confundimento e interacção, devendo também ser apresentados apenas os RR de cada estrato, não sendo compreensível um RR global.

© António Paula Brito de Pina, 2006