Quando fazemos estimativas pontuais, não há como julgar qual a magnitude do possível erro da estimativa, apenas sabemos que o valor verdadeiro do parâmetro está próximo da estimativa. Assim, a estimação intervalar nos fornece meios de determinar não só uma estimativa, mas um intervalo de confiança, ou seja, um intervalo de valores plausíveis para o parâmetro (o que não significa que o parâmetro está com certeza nesse intervalo).
Os intervalos de confiança são obtidos a partir da distribuição amostral dos estimadores pontuais. Não há como determinar com certeza se o intervalo de confiança contém o parâmetro populacional (pois ele é desconhecido), porém esse intervalo é construído com base em um alto nível de confiança fixado de que ele contém o parâmetro.
Intervalo de confiança
Dada uma amostra aleatória da variável aleatória que representa uma característica observável da população , tal que a função de distribuição (ou densidade) de probabilidade de é (ou ), em que é um parâmetro populacional desconhecido. Se é um estimador de cuja distribuição amostral é conhecida, sempre é possível encontrar dois valores e tais que
em que é o coeficiente de confiança do intervalo.
Note que, para obter um intervalo de confiança, é necessário obter um estimador e sua distribuição. É natural então que bons estimadores produzam bons intervalos, e de fato produzem. Portanto, buscaremos sempre utilizar os estimadores de máxima verossimilhança para construir bons intervalos de confiança.
Intervalos de confiança para a proporção populacional
Seja a proporção (desconhecida) de indivíduos ou objetos de uma certa população que são portadores de uma determinada característica . Dada uma amostra da variável aleatória , obtida a partir dessa população, o estimador de máxima verossimilhança de é a proporção amostral
Para suficientemente grande, segue pelo Teorema Central do Limite que
Normalizando a distribuição, temos
Dessa forma, para um coeficiente de confiança , temos
A partir disso, podemos construir dois intervalos de confiança. O primeiro é um intervalo conservador, geralmente utilizado para não suficientemente grande:
O segundo é um intervalo mais preciso, porém depende de um suficientemente grande:
Intervalos de confiança para a média de populações normais
Dado um espaço de probabilidade associado a um experimento aleatório, e uma amostra aleatória da variável aleatória tal que , e . Quando é desconhecido e é conhecido, o estimador de máxima verossimilhança para é e
Dessa forma, fixado um nível de confiança , existem tal que
Assim, um intervalo com nível de confiança para é
Porém, quando a variância da variável aleatória também é um parâmetro desconhecido, não podemos utilizar esse mesmo intervalo de confiança para , pois esse intervalo depende da variância populacional.
No caso da variância populacional ser desconhecida, podemos utilizar a variância amostral para estimar . Porém com isso devemos considerar outra distribuição, e aí que entra a distribuição t-Student. Dizemos então que a variável não possui mais distribuição normal padrão, mas sim distribuição t-Student com graus de liberdade.
Dessa forma, fixado um nível de confiança , existe tal que
Portanto, um intervalo com nível de confiança para é
Intervalos de confiança para a variância de populações normais
Dado um espaço de probabilidade associado a um experimento aleatório, e uma amostra aleatória da variável aleatória tal que , e são parâmetros desconhecidos. Para construir um intervalo de confiança para , utilizamos a variância amostral como estimador e introduzimos uma outra distribuição, a qui-quadrado.
Consideramos o seguinte fato:
em que
é a variância amostral e é uma distribuição qui-quadrado com graus de liberdade.
Note que a distribuição qui-quadrado, ao contrário da Normal e t-Student, não é simétrica. Portanto, dado um nível de confiança , devemos tomar e tais que
em que
ou seja,
Assim,
Portanto, um intervalo com nível de confiança para é