Estatística Descritiva

Portal de Saúde Pública

Investigação e Estatística

1. Estatística Descritiva

Quando queremos investigar, o primeiro objectivo é descrever o fenómeno. Por isso, a primeira fase de tratamento dos dados é a análise univariada, através da verificação das frequências e o cálculo das medidas de localização central e de dispersão para cada variável isoladamente.

Geralmente, não se calculam mais que as seguintes medidas:

• as frequências absolutas (números absolutos de cada valor) e as frequências relativas (as proporções em percentagens ou permilagens, etc.).

• a média e desvio-padrão

• a mediana e desvio-quartil

• a moda.

No entanto, as medidas atrás referidas não poderão ser calculadas para qualquer tipo de variável. Tudo depende da escala de valores de cada variável, pelo que aqui será importante fazer um pequeno parêntesis para classificarmos as variáveis quanto à sua escala. Compreender esta classificação é de importância crucial para utilizarmos de forma adequada a estatística. Sumariamente, poderemos classificar as variáveis da seguinte forma:

1- Variáveis qualitativas nominais: são variáveis cujos valores não tem uma relação de ordem entre eles, por ex., o Sexo e Raça.

Para este tipo de variáveis poder-se-á fazer o estudo das frequências absolutas e relativas (no EpiInfo escolhemos o Comando FREQUENCIES).

2- Variáveis qualitativas ordinais, cujos valores não são métricos mas incluem relações de ordem. É o caso da variável "Peso" medida em 3 níveis (pouco pesados, pesados, muito pesados).

Para este tipo de variáveis poder-se-á fazer tudo quanto é possível fazer-se para as variáveis nominais, mas também adicionalmente é possível estudar as medianas, quartis, modas (Comando MEANS no EpiInfo);

3- Variáveis quantitativas, cujos valores são medidos numa escala métrica, como por ex., a "Idade", ou o "Peso" medido em gramas.

Para este tipo de variáveis poder-se-á fazer tudo quanto é possível fazer-se para as variáveis nominais e ordinais, mas também adicionalmente é possível estudar as médias e desvios-padrão (Comando MEANS no EpiInfo).

Se quiser utilizar o EpiInfo (disponível gratuitamente em www.cdc.gov/epiinfo), aconselho a criar uma pequena base de dados, (recomenda-se estudar o Manual existente neste site), e que poderemos nomear "Experiência":

Nome	Data de Nascimento	Data Actual	Peso	Sexo
João	13-12-1973	15-12-2000	60	homem
Maria	10-07-1961	15-12-2000	55	mulher
Manuel	20-11-1980	15-12-2000	80	homem
Luís	11-05-1950	15-12-2000	75	homem
Ana	15-08-1985	15-12-2000	50	mulher

Índice

Parte 1 - metodologia básica da investigação

1º Identificação do assunto a investigar

2º Identificação das variáveis do estudo

3º Identificação da população e amostra do estudo

4º Definição do desenho do estudo

5º Planeamento da recolha e análise dos dados

6º Interpretação dos resultados (e elaboração do relatório)

Parte 2 - noções de estatística

1. Estatística descritiva

2. Estatística dedutiva

2.1 Intervalos de confiança

2.2 Testes Qui-quadrado e Fisher

2.3 Testes de Student / ANOVA e de Mann-Whitney / Kruskal-Wallis

3. Força da associação

3.1 Estudos de coorte

3.2 Estudos de caso-controlo

Anexo 1 - Revisão bibliográfica

Anexo 2 - Controlo das variáveis interferentes

Anexo 3 - Cálculo da dimensão da amostra

Bibliografia

[1] Apesar de tudo, existe a possibilidade de comparar graficamente classes de diferentes amplitudes através dos histogramas que, são gráficos em que a área das colunas representam o número de indivíduos (ao invés da altura das colunas). No entanto, apesar deste tipo de gráficos ser muito falado nos cursos de estatística, raramente se vêm em artigos ...