Quando fazemos estimativas pontuais, não há como julgar qual a magnitude do possível erro da estimativa, apenas sabemos que o valor verdadeiro do parâmetro está próximo da estimativa. Assim, a estimação intervalar nos fornece meios de determinar não só uma estimativa, mas um intervalo de confiança, ou seja, um intervalo de valores plausíveis para o parâmetro (o que não significa que o parâmetro está com certeza nesse intervalo).
Os intervalos de confiança são obtidos a partir da distribuição amostral dos estimadores pontuais. Não há como determinar com certeza se o intervalo de confiança contém o parâmetro populacional (pois ele é desconhecido), porém esse intervalo é construído com base em um alto nível de confiança fixado de que ele contém o parâmetro.

Intervalo de confiança
Dada uma amostra aleatória $(X_{1}, X_{2}, \dots, X_{n})$ da variável aleatória $X$ que representa uma característica observável da população $P$ , tal que a função de distribuição (ou densidade) de probabilidade de $X$ é $p (x ∣ θ)$ (ou $f (x ∣ θ)$ ), em que $θ \in Θ$ é um parâmetro populacional desconhecido. Se $\hat{θ} = T (X_{1}, \dots, X_{n})$ é um estimador de $θ$ cuja distribuição amostral é conhecida, sempre é possível encontrar dois valores $t_{1} := t_{1} (X_{1}, \dots, X_{n})$ e $t_{2} := t_{2} (X_{1}, \dots, X_{n})$ tais que

P (t_{1} \leq θ \leq t_{2}) = γ

em que $γ$ é o coeficiente de confiança do intervalo.

Note que, para obter um intervalo de confiança, é necessário obter um estimador e sua distribuição. É natural então que bons estimadores produzam bons intervalos, e de fato produzem. Portanto, buscaremos sempre utilizar os estimadores de máxima verossimilhança para construir bons intervalos de confiança.

Intervalos de confiança para a proporção populacional

Seja $p \in] 0, 1 [$ a proporção (desconhecida) de indivíduos ou objetos de uma certa população $P$ que são portadores de uma determinada característica $X$ . Dada uma amostra $(X_{1}, X_{2}, \dots, X_{n})$ da variável aleatória $X$ , obtida a partir dessa população, o estimador de máxima verossimilhança de $p$ é a proporção amostral

\overset{p}{^} := \frac{1}{n} i = 1 \sum n X_{i}

Para $n$ suficientemente grande, segue pelo Teorema Central do Limite que

\overset{p}{^} ≃ N or ma l (p, \frac{p ( 1 - p )}{n})

Normalizando a distribuição, temos

\frac{p ^ - p}{\frac{p ( 1 - p )}{n}} ≃ N or ma l (0, 1)

Dessa forma, para um coeficiente de confiança $γ \in] 0, 1 [$ , temos

P (\overset{p}{^} - z \frac{p ( 1 - p )}{n} \leq p \leq \overset{p}{^} + z \frac{p ( 1 - p )}{n}) = γ

A partir disso, podemos construir dois intervalos de confiança. O primeiro é um intervalo conservador, geralmente utilizado para $n$ não suficientemente grande:

[\overset{p}{^} - \frac{z}{2 n}; \overset{p}{^} + \frac{z}{2 n}]

O segundo é um intervalo mais preciso, porém depende de um $n$ suficientemente grande:

[\overset{p}{^} - z \frac{p ^ ( 1 - p ^ )}{n}; \overset{p}{^} + z \frac{p ^ ( 1 - p ^ )}{n}]

Intervalos de confiança para a média de populações normais

Dado um espaço de probabilidade $(Ω, F, P)$ associado a um experimento aleatório, e $(X_{1}, X_{2}, \dots, X_{n})$ uma amostra aleatória da variável aleatória $X : Ω \to R$ tal que $X \sim N or ma l (μ, σ^{2})$ , $μ \in R$ e $σ^{2} > 0$ . Quando $μ$ é desconhecido e $σ^{2} = σ_{0}^{2}$ é conhecido, o estimador de máxima verossimilhança para $μ$ é $\overset{ˉ}{X}$ e

\frac{X ˉ - μ}{σ / n} \sim N or ma l (0, 1)

Dessa forma, fixado um nível de confiança $γ \in] 0, 1 [$ , existem $z \in R_{+}$ tal que

P (- z \leq \frac{X ˉ - μ}{σ / n} \leq z) = γ

Assim, um intervalo com nível de confiança $γ$ para $μ$ é

[\overset{ˉ}{X} - z \frac{σ _{0}}{n}; \overset{ˉ}{X} + z \frac{σ _{0}}{n}]

Porém, quando a variância $σ^{2}$ da variável aleatória $X$ também é um parâmetro desconhecido, não podemos utilizar esse mesmo intervalo de confiança para $μ$ , pois esse intervalo depende da variância populacional.

No caso da variância populacional ser desconhecida, podemos utilizar a variância amostral $S^{2}$ para estimar $σ^{2}$ . Porém com isso devemos considerar outra distribuição, e aí que entra a distribuição t-Student. Dizemos então que a variável não possui mais distribuição normal padrão, mas sim distribuição t-Student com $n - 1$ graus de liberdade.

T := \frac{X ˉ - μ}{S / n} \sim t_{(n - 1)}

Dessa forma, fixado um nível de confiança $γ \in] 0, 1 [$ , existe $t \in R$ tal que

P (- t \leq \frac{X ˉ - μ}{S / n} \leq t) = γ

Portanto, um intervalo com nível de confiança $γ$ para $μ$ é

[\overset{ˉ}{X} - t \frac{S}{n}; \overset{ˉ}{X} + t \frac{S}{n}]

Intervalos de confiança para a variância de populações normais

Dado um espaço de probabilidade $(Ω, F, P)$ associado a um experimento aleatório, e $(X_{1}, X_{2}, \dots, X_{n})$ uma amostra aleatória da variável aleatória $X : Ω \to R$ tal que $X \sim N or ma l (μ, σ^{2})$ , $μ \in R$ e $σ^{2} > 0$ são parâmetros desconhecidos. Para construir um intervalo de confiança para $σ^{2}$ , utilizamos a variância amostral $S^{2}$ como estimador e introduzimos uma outra distribuição, a qui-quadrado.
Consideramos o seguinte fato:

\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim X_{(n - 1)}

em que

S^{2} := \frac{1}{n - 1} i = 1 \sum n (X_{1} - \overset{ˉ}{X})^{2}

é a variância amostral e $X_{(n - 1)}$ é uma distribuição qui-quadrado com $n - 1$ graus de liberdade.
Note que a distribuição qui-quadrado, ao contrário da Normal e t-Student, não é simétrica. Portanto, dado um nível de confiança $γ \in] 0, 1 [$ , devemos tomar $q_{1} \geq 0$ e $q_{2} \geq 0$ tais que

P (Q \geq q_{2}) = P (Q \leq q_{1}) = \frac{1 - γ}{2}

em que

Q = \frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim X_{(n - 1)}

ou seja,

P (q_{1} \leq \frac{( n - 1 ) S ^{2}}{σ ^{2}} \leq q_{2}) = γ

Assim,

P (\frac{( n - 1 ) S ^{2}}{q _{2}} \leq σ^{2} \leq \frac{( n - 1 ) S ^{2}}{q _{1}}) = γ

Portanto, um intervalo com nível de confiança $γ$ para $σ^{2}$ é

[\frac{( n - 1 ) S ^{2}}{q _{2}}; \frac{( n - 1 ) S ^{2}}{q _{1}}]

Luís's Zettelkasten 🪴

Recent posts

Homelab SSL certificates

Shiny object syndrome

Recent notes

The art of finishing

Making decisions

Ceph

Estimação intervalar

Intervalos de confiança para a proporção populacional

Intervalos de confiança para a média de populações normais

Intervalos de confiança para a variância de populações normais

Graph View

Table of Contents

Backlinks