segunda-feira, 9 de julho de 2012

Noções básicas sobre amostragem probabilística


A amostragem será probabilística quando cada elemento da população tem uma probabilidade conhecida e igual de ser selecionado. Caso contrário, a amostragem será não probabilística. Segundo essa definição, a amostragem probabilística implica um sorteio com regras bem determinadas, cuja realização só será possível se a população for finita e totalmente acessível. 

A grande vantagem deste método é que os resultados obtidos na pesquisa podem ser projetados para a população total.





I- Tipos de amostragem probabilística:


a) Amostragem aleatória simples (AAS)
b) Amostragem estratificada;

c) Amostragem sistemática;

d) Amostragem por conglomerado;


a) A amostragem aleatória simples (AAS) é a maneira mais fácil para selecionarmos uma amostra probabilística de uma população. Ela é composta por elementos retirados ao acaso da população. Então todo elemento da população deve ter igual probabilidade de ser escolhido para a amostra. Esse procedimento de amostragem possui dois critérios:

- pode ser feita amostragem aleatória simples sem reposição;

- pode ser feita amostragem aleatória simples com reposição.

A amostragem aleatória simples sem reposição é um processo bastante utilizado principalmente pela sua simplicidade. Nela cada unidade amostral, antes da tomada da amostra, tem igual probabilidade de pertencer à ela e quando a unidade é sorteada ela é removida da população ou seja, cada unidade só pode ser escolhida uma única vez.

Exemplo:

Um professor quer obter uma amostra aleatória simples sem reposição que seja representativa, de 10%, de uma população de 200 alunos de uma escola, como deve proceder?


1º) Numerar os alunos de 1 a 200;


2º) Escrever os números de 1 a 200 em pedaços de papel e colocá-los em uma urna;


3º) Retirar 20 pedaços de papel, um a um, da urna, formando a amostra da população.


Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados: 1/N, onde N é o número total de elementos da população e 1 é a probabilidade de cada indivíduo ser selecionado.


Quando a população é muito grande, esse tipo de procedimento torna-se inviável. Nesse caso, usa-se um processo alternativo, no qual os elementos são numerados e em seguida sorteados por meio de uma tabela de números aleatórios, sorteando-se um elemento da população até que sejam sorteadas as unidades da amostra. Também neste caso todos os elementos devem ter a mesma probabilidade de ser selecionados.


A amostragem aleatória simples com reposição permite que cada elemento da população tenha a mesma probabilidade de ser selecionado e esta probabilidade se mantém constante ao longo de todo o processo de seleção da amostra (se as extrações fossem sem reposição isso não aconteceria). Ou seja, durante o sorteio, a unidade amostral já sorteada retorna para a população. Portanto em cada seleção a população mantém a mesma quantidade de unidades elementares para serem sorteadas.

Exemplo:

Uma caixa contém dez bolas numeradas de 0 a 9. O objetivo é selecionar números de 2 dígitos para a construção de uma tabela de números aleatórios. Retira-se a primeira bola e anota-se o número, 5 por exemplo. Se esta bola for recolocada na caixa então, novamente todos os números podem ser selecionados na segunda retirada, inclusive o número 5.

Quando devemos utilizar amostras com reposição ou sem reposição?


Quando a população é grande (infinita) selecionar amostras com ou sem reposição não irá alterar a probabilidade do elemento seguinte ser selecionada.

Em geral, deve-se dar preferência ao tipo de amostragem aleatória simples sem reposição, principalmente quando se trata de populações com reduzido número de unidades amostrais Berquó (1981).

Observação importante: Ao compor amostras com seres humanos, é mais apropriado ter uma amostra com pessoas diferentes do que permitir medições repetidas da mesma pessoa. Assim sendo, empregaríamos o método de amostragem sem reposição, de modo que, uma vez retirado determinado indivíduo, o mesmo não poderia ser selecionado novamente


b) A amostragem aleatória estratificada deve ser realizada quando a população for constituída por diferentes estratos. Muitas vezes uma população é composta de subpopulações (ou estratos) bem definidos. A amostra estratificada deverá ser composta por elementos provenientes de todos os estratos.

Por exemplo, se as pessoas que moram nos vários bairros de uma cidade são diferentes, cada bairro é um estrato. Para obter uma amostra de pessoas dessa cidade, seria razoável obter uma amostra de cada bairro e depois reunir as informações numa amostra estratificada (Vieira, 1991).


IMPORTANTE: A seleção de cada estrato deve ser aleatória.

A amostra aleatória estratificada pode ser uniforme ou proporcional:
Apesar de a amostragem estratificada apresentar resultados satisfatórios, a sua implementação é dificultada pela falta de informações sobre a população para fazer a estratificação. Para poder contornar este problema, você pode trabalhar com o esquema de amostragem chamado amostragem por conglomerados.
Amostra estratificada uniforme:  É a forma mais comum de selecionar elementos de uma população, devemos sortear o MESMO número de elementos em cada estrato. Este tipo de amostra é recomendável apenas se os estratos da população forem pelo menos aproximadamente do mesmo tamanho.


Exemplo: Número de pessoas que vivem nos domicílios de uma determinada cidade. Dividir os domicílios em níveis socioeconômicos e depois selecionar domicílios em cada nível aleatoriamente (Renda baixa, média, alta).

Amostra estratificada proporcional: Quando existem diferentes estratos e estes, apesar de apresentarem grande homogeneidade dentro deles são heterogêneos entre eles. Sexo, idade, condição socioeconômica, são exemplos típicos. Por exemplo, se o interesse for avaliar a ocorrência de determinado agravo em uma cidade e as condições sociais das pessoas são diferentes em cada bairro então se devem levar em consideração cada extrato e o sorteio da amostra deve ser feito em cada um deles independentemente. Daí o nome de amostragem estratificada


Quando houver proporções diferentes entre os estratos da população é recomendável que o número de elementos sorteados em cada estrato sorteado seja proporcional ao número de elementos no estrato selecionado.


Exemplo de Amostra aleatória estratificada proporcional:

Em uma escola há 100 alunos, entre os quais 70 são homens e 30 são mulheres.


1- Para selecionar uma amostra aleatória estratificada proporcional com 10 pessoas (lembrar que este número é o tamanho da amostra que deve ter sido previamente determinado), devemos dividir a população em dois estratos: homens e mulheres.


Em um total de 100 alunos se 70 são homens então: (70 / 100) x 100 = 70% e se 30 são mulheres então: (30 / 100) x 100 = 30%. Logo 70% da amostra deverão ser homens e 30% da amostra deverão ser mulheres. Se a amostra deve ser composta por 10 pessoas então: deverão ser selecionados 7 homens e 3 mulheres.

A seleção dessas 10 pessoas deverá ser feita por meio de sorteio, de acordo com os conceitos da amostragem aleatória simples.


2- Se esta amostra estratificada proporcional fosse de 30 pessoas. Lembrar que o universo da população masculina é de 70 homens. Então, logo teremos (70 x 30)/100 = 21 homens que deveriam ser selecionados para a amostra. O universo da população feminina é de 30 mulheres. Então, (30 x30)/100 = 9 mulheres que deveriam ser selecionadas para a amostra.


Ao contrário da Amostragem Aleatória Simples, a amostragem Estratificada é ideal para populações heterogêneas no entanto, exige maior conhecimento sobre a população para que se possa identificar os grupos homogêneos dentro dela e poder dividi-la em subgrupos (estratos) para que se possa realizar uma amostragem dentro de cada estrato.

Por exemplo:

Deseja-se avaliar a aceitação de determinados métodos de controle de natalidade em uma determinada cidade.

O que se deve levar em conta para selecionar a população?

Religião: católicos, protestantes e judeus.

Situação socioeconômica: alta, média e baixa.

Quais os tipos de estratos que poderiam ser formados nesta população?

• Protestantes de classe alta;

• Protestantes de classe média;

• Protestantes de classe baixa;

• Católicos de classe alta;

• Católicos de classe média;

• Católicos de classe baixa;

• Judeus de classe alta;

• Judeus de classe média;

• Judeus de classe baixa.

Retiramos amostras aleatórias simples de cada estrato.

NUNCA SE ESQUECER QUE: se as proporções forem diferentes entre os estratos a seleção da amostra estratificada DEVERÁ SER PROPORCIONAL.

c) A amostragem sistemática: Quando os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente, temos uma amostragem sistemática. A principal vantagem da amostragem sistemática está na grande facilidade na determinação dos elementos da amostra. O perigo em adota-la está na possibilidade da existência de ciclos de variação da variável de interesse, especialmente se o período desses ciclos coincidir com o período de retirada dos elementos da amostra.

Por outro lado, se a ordem dos elementos na população não tiver qualquer relacionamento com a variável de interesse, então a amostragem sistemática terá efeitos equivalentes a casual simples, podendo ser utilizada sem restrições.Na amostra sistemática os elementos são escolhidos não por acaso, mas por um sistema. Quando temos uma população organizada, é mais fácil obter uma amostra sistemática do que uma amostra aleatória simples. Por exemplo, para obter uma amostra de 2% (proporção que já foi previamente estabelecida pelo cálculo do tamanho da amostra), dos prontuários dos pacientes de uma clínica, é mais fácil pegar o último de cada 50 prontuários do que fazer um sorteio até conseguir 2% do total de prontuário. As amostras sistemáticas são muito usadas, mas exigem especial preocupação com o sistema de seleção. Por exemplo, se os elementos da população estão em fila, não se deve selecionar os “primeiros”, ou os “últimos”, nem mesmo “os do meio”, é preciso percorrer toda a fila e escolher, por exemplo, o décimo de cada grupo de dez.


Exemplos de amostragem sistemática:

1º. Se em uma população constituída de 500 elementos e a amostra deve ser de 50 elementos onde N = 500 e n = 50, dividem-se N por n, isto é, 500 por 50, obtendo-se 10. Em seguida, sorteia-se um número da 1ª dezena e, a partir dele, escolhem-se os demais, observando-se que se o número sorteado for, por exemplo, 5, o segundo deverá ser 15 (5+10), o terceiro o 25 (15+10), e assim por diante até obter-se os 50 elementos que constituirão a amostra.

2º. Uma população é formada de 30 pessoas e desejamos formar amostras aleatórias sistemáticas com 6 pessoas. O valor de h será 30/6 = 5. Sorteia-se um número entre 1 a 5. Se o número sorteado foi o 4, então h = 4. A amostra sistemática será formada pelos valores que se colocarem nas posições: 4º, 9º, 14º, 19º, 24º e 29º elemento. Se o número sorteado de 1 a 5 fosse o 3, então a = 3 e a amostra seria formada pelos números que estiverem na ordem: 3º, 8º, 13º 18º, 23º e 28º número. Se o número sorteado de 1 a 5 fosse o 1, então a = 1 e a amostra seria formada pelos números que estiverem na ordem: 1º, 6º, 11° 16º, 21º e 26º número.


d) A amostragem por conglomerado ou cluster: 
Por Conglomerado entende-se um grupamento natural de elementos da população, os quais são bastante heterogêneos internamente em relação à característica estudada, porém de comportamento similar entre os conglomerados. Neste tipo de amostra é realizado o sorteio não dos indivíduos, mas de grupos naturalmente organizados (cidades, bairros, quarteirões, etc). Este tipo de amostragem é bastante útil quando não é possível obter uma listagem de todos os membros da população. Geralmente a amostragem por conglomerados está associada a outro tipo de amostragem probabilística. 

Em um primeiro momento sorteiam-se os conglomerados através de uma amostragem aleatória. Nos conglomerados sorteados realiza-se uma segunda fase da amostragem, geralmente do tipo simples ou sistemática. Um exemplo comum é utilizar os setores censitários como conglomerados para iniciar a obtenção de uma amostra representativa de um município. Outro exemplo seria selecionar, em um bairro, seis quarteirões. Cada quarteirão corresponde, assim, a um conglomerado. Posteriormente é efetuado o levantamento de dados na totalidade dos indivíduos (ou residências) existentes nesses seis conglomerados.

Comparativamente à amostragem aleatória simples, a amostragem por conglomerados é considerada menos representativa ou com maior viés. Contudo, tem a vantagem da praticidade, gerando pesquisas mais rápidas e baratas. A utilização da amostragem por conglomerados possibilita uma redução significativa do custo do processo de amostragem. Portanto, um conglomerado é um subgrupo da população, que individualmente reproduz a população, ou seja, individualmente os elementos que o compõem são muito heterogêneos entre si.

Exemplo de estudos utilizando amostragem por conglomerados:

Desejo estimar o rendimento médio familiar em uma grande cidade.

Como deve ser escolhida a amostra?

Como não há uma listagem de todas as famílias da cidade e é praticamente impossível obtê-la, não é possível usar a amostragem aleatória simples e estratificada então:

A cidade foi dividida em bairros (conglomerados) e tomada uma amostra aleatória dos bairros e neles pesquisa-se a renda de todas as famílias do bairro. Pode-se também em cada bairro selecionar quarteirões, mas LEMBREM-SE, cada conglomerado deve ser visualizado como uma espécie de miniatura da população; portanto, será tanto melhor quanto maior a heterogeneidade dentro de cada conglomerado.

IMPORTANTE: A amostragem por conglomerado não é exclusiva de estudos que envolvem área geográfica. Ela pode ser utilizada também em situações quando não se possui o conhecimento de toda a população em que a população é heterogênea e não se possui uma lista contendo todos os nomes dos elementos da população (clínicas, escolas, indústrias, etc);

 Muitas vezes a amostragem por conglomerados pode ser uma opção quando é necessário selecionar 
amostras de uma população que seja heterogênea mas que, pelo fato de não se ter uma listagem dos elementos que pertencem a ela não se pode optar por uma amostragem estratificada (a qual necessita destas informações para que os estratos da população sejam identificados). 

Exemplo:


Deseja-se obter uma amostra de pacientes para entrevistas pessoais de aceitação de um novo equipamento a ser utilizado no atendimento. A clientela é bastante heterogênea e a clínica atende uma média de 400 pacientes. De acordo com cálculo amostral previamente realizado, será necessária uma amostra de 40 pacientes. Esta pode ser escolhida a partir de quatro consultórios, num total de dez, ou seja, quatro conglomerados de pacientes (cada consultório é um conglomerado). A seguir, selecionam-se, os pacientes dos quatro consultórios (elementos amostrais).Os resultados do estudo serão compilados para os 4 consultórios que representarão a opinião de todos os pacientes atendidos na clínica.

OBSERVAÇÃO:

Em geral, a amostragem por conglomerados é menos eficiente que a Amostragem Aleatória Simples ou Amostragem aleatória estratificada mas, por outro lado, é bem mais econômica. A amostragem por conglomerados é adequada quando é possível dividir a população em vários pequenos grupos (subpopulações).

A amostragem por conglomerados deve ter as seguintes características:

Dentro de cada conglomerado deve haver grande heterogeneidade (grande variabilidade);

Entre os conglomerados, deve haver pequena variabilidade (grande homogeneidade)
Bibliografia: http://www.ime.unicamp.br/~cnaber/aula_AC.pdf  

Neto, Pedro L. C. Estatística. 2ª edição. Ed. Blucher Ltda, 2002.

Berquó, Elza Salvatori; Souza, Maria Pacheco; Gotlieb, Sabina Léa Davidson. Bioestatística – 1. Ed. rev. – São Paulo: EPU, 1981.

Vieira, Sonia. Introdução à bioestatística – 1ª Ed. - Rio de Janeiro: Campus, 1991.





11 comentários:

  1. Obrigado pelo post, foi util :)

    ResponderExcluir
  2. Obrigado foi muito útil.... :D

    ResponderExcluir
  3. obrigadooo, foi muito útil =D
    vlw mesmo ^^

    ResponderExcluir
  4. ótimo post, ficou excelente, parabéns!
    me ajudou bastante!
    valeu. =)

    ResponderExcluir
  5. otimoooooooooooooooooooo, muito bem explicado, obrigada!!!!!!!!!!!

    ResponderExcluir
  6. Agradeço a todos. Minha intenção realmente é facilitar o trabalho do aluno que está iniciando e dificilmente encontra explicações em uma linguagem de fácil entendimento.
    Fico feliz por ter ajudado vocês.
    Nádia

    ResponderExcluir
  7. Muito bom!!! Gostaria de saber quais as vantagens e desvantagens da amostra probabilística aleatória estratificada?? E amostra conglomerado?

    ResponderExcluir
  8. FOI MUITO BOM ,CONTIUDO BEM DETALHADO E BEM EXPLICADA MUITO OBRIGADA

    ResponderExcluir
  9. É bastante explicito, valeu.

    ResponderExcluir
  10. Quanto à pergunta sobre as vantagens e desvantagens da amostra probabilística estratificada e a amostra por conglomerado. Aqui vai a resposta:A amostragem probabilística aleatória estratificada é recomendável apenas quando a população pode ser subdividida em subpopulações que são os estratos e estes devem ser homogêneos e pelo menos serem aproximadamente do mesmo tamanho. A grande vantagem deste tipo de amostra é que você pode generalizar os seus resultados. A AMOSTRA É FEITA A PARTIR DE INDIVÍDUOS DA POPULAÇÃO. No entanto, a desvantagem é que apesar de a amostragem estratificada apresentar resultados satisfatórios, muitas vezes a falta de informações sobre a população pode dificultar o processo de estratificação. Sumarizando, a amostragem estratificada proporcional apresenta os melhores resultados possíveis. A grande dificuldade em deve-se ao grau de conhecimento necessário sobre a população, que geralmente não existe ou é impraticável de ser obtido. Uma forma alternativa de amostragem consiste no uso de conglomerados.
    A amostragem por Conglomerado, A AMOSTRAGEM É FEITA A PARTIR DE GRUPOS (MORADORES DE UM DETERMINADO BAIRRO) E NÃO DE INDIVÍDUOS O primeiro passo para se usar este processo é especificar conglomerados apropriados. Os elementos em um conglomerado devem ter características similares. Este tipo de amostragem deve ser utilizado para reduzir custos de pesquisas que abrangem grande extensão de área, você tem uma maior facilidade para obter a amostra economiza dinheiro e tempo porque permite concentrar os sujeitos da pesquisa em áreas próximas,

    ESPERO TER AJUDADO.
    Nádia

    ResponderExcluir

Não esqueça de informar seu nome. Vá até 'Comentar como:', logo abaixo do campo de comentários, e clique em 'Nome/URL'.
Seria muito bom conhecer você!