SZZ materiály

9

Intervaly spolehlivosti, jejich význam, interpretace a konstrukce (definice, typy, interpretace spolehlivosti, resp. hladiny významnosti, výpočet [pro střední hodnotu, rozptyl, relativní četnost], vliv rozsahu výběru, využití v praxi)

Užitečné odkazy

Obecné poznatky

Interval spolehlivosti

Uprostřed intervalu se nachází výběrový průměr $\bar{x}$, tedy bodový odhad skutečného populačního průměru $\mu$. Prostředních $95\%$ představuje interval spolehlivosti, tedy oblast nejpravděpodobnějších hodnot pro skutečný populační průměr. Zbývajících $5\%$ tvoří hladina významnosti $\alpha = 0.05$, která je u oboustranného intervalu rozdělena na dvě části: $2.5\%$ vlevo a $2.5\%$ vpravo.

Populace

Matematicky: \(P=\{x_1,x_2,\dots,x_n\}\)

kde:

Vzorek

Matematicky: \(S \subseteq P \qquad S=\{x_1,x_2,\dots,x_n\}\)

kde:

Příklad

Představme si, že chceme zjistit průměrnou výšku českých mužů ve věku 20 let. I když nemáme možnost oslovit a změřit výšku každého českého muže ve věku 20 let, tak můžeme z populace náhodně vybrat vzorek, např. 1000 mužů, u kterých výšku změříme. Prakticky to znamená, že náhodně oslovíme nějaký počet takových mužů. Ti muži, kteří se do našeho průzkumu zapojí, se nazývají respondenti. Na základě náhodného výběru vznikne námi naměřený vzorek (množina výšek českých mužů ve věku 20 let). Na základě vzorku provedeme statistický odhad parametru populace (parametrem je v tomto případě výška) a určíme interval spolehlivosti.

Interval spolehlivosti pro střední hodnotu

\[\bar{x} \pm \frac{s}{\sqrt{n}} \cdot t_{n-1}\left(1-\frac{\alpha}{2}\right)\]

kde:

Kód

# vzorek
heights <- c(181, 176, 179, 182, 177, 180, 178, 175)

# n
n <- length(heights)

# x̄
x_bar <- mean(heights)

# s
s <- sd(heights)

# α
alpha <- 0.05

# t_(n-1)(1 - α/2)
t_value <- qt(1 - alpha / 2, df = n - 1)

# (s / sqrt(n))
standard_error <- s / sqrt(n)

# (s / sqrt(n)) * t_(n-1)(1 - α/2)
# chyba odhadu
margin_error <- standard_error * t_value

# dolní mez intervalu
lower <- x_bar - margin_error

# horní mez intervalu
upper <- x_bar + margin_error

# interval spolehlivosti
c(lower, upper)

nebo:

heights <- c(181, 176, 179, 182, 177, 180, 178, 175)

# x̄
mean(heights)

# x̄ ± (s / sqrt(n)) * t_(n-1)(1 - α/2)
t.test(heights)$conf.int

Interval spolehlivosti pro podíl

Příklad

Interval spolehlivosti pro rozdíl

Příklad

Šířka intervalu spolehlivosti

Populační průměr

Značí se: \(μ\)

Výběrový průměr

Značí se: \(\bar{x}\)

Hladina významnosti

Značí se: \(α\)