Una macchina riempie delle tazze di margarina. Per l'esempio, la macchina è regolata in modo che il contenuto delle tazze sia di 250 g di margarina. Poiché la macchina non può riempire ogni tazza esattamente con 250 g, il contenuto aggiunto alle singole tazze mostra una certa variazione, ed è considerato una variabile casuale X. Questa variazione si assume essere normalmente distribuita intorno alla media desiderata di 250 g, con una deviazione standard di 2,5 g. Per determinare se la macchina è adeguatamente calibrata, un campione di n = 25 tazze di margarina viene scelto a caso e le tazze vengono pesate. I pesi della margarina sono X1, ..., X25, un campione casuale di X.
Per avere un'impressione dell'aspettativa μ, è sufficiente dare una stima. Lo stimatore appropriato è la media del campione:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {displaystyle {{hat {\mu }}={{barra {X}}={frac {1}{n}}}sum _{i=1}^{n}X_{i}. } 
Il campione mostra i pesi reali x1, ...,x25, con la media:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 grammi . {displaystyle {bar {x}}={frac {1}{25}}}sum _{i=1}^{25}x_{i}=250,2\, {text{grammi}}. } 
Se prendiamo un altro campione di 25 tazze, potremmo facilmente aspettarci di trovare valori come 250,4 o 251,1 grammi. Un valore medio del campione di 280 grammi sarebbe però estremamente raro se il contenuto medio delle tazze è in effetti vicino a 250g. C'è un intero intervallo intorno al valore osservato 250,2 della media del campione all'interno del quale, se l'intera media della popolazione assume effettivamente un valore in questo intervallo, i dati osservati non sarebbero considerati particolarmente insoliti. Un tale intervallo è chiamato intervallo di confidenza per il parametro μ. Come si calcola un tale intervallo? Gli estremi dell'intervallo devono essere calcolati a partire dal campione, quindi sono statistiche, funzioni del campione X1, ..., X25 e quindi variabili casuali esse stesse.
Nel nostro caso possiamo determinare i punti finali considerando che la media campionaria X da un campione normalmente distribuito è anche normalmente distribuita, con la stessa aspettativa μ, ma con errore standard σ/√n = 0,5 (grammi). Standardizzando otteniamo una variabile casuale
Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {displaystyle Z={frac {{barra {X}}-\mu }{sigma /{sqrt {n}}}}={frac {{barra {X}}-\mu }{0.5}} 
dipendente dal parametro μ da stimare, ma con una distribuzione normale standard indipendente dal parametro μ. Quindi è possibile trovare numeri -z e z, indipendenti da μ, dove Z sta in mezzo con probabilità 1 - α, una misura di quanto vogliamo essere fiduciosi. Prendiamo 1 - α = 0,95. Quindi abbiamo:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. P(-z ≤ Z ≤ z)=1-\alpha =0,95. 
Il numero z segue dalla funzione di distribuzione cumulativa:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0.975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0.975 ) = 1.96 , {displaystyle {begin{aligned}\Phi (z)&=P(Z\leq z)=1-{tfrac {alpha }{2}}=0,975,\\\[6pt]z&=Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}} ![{\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}](https://www.alegsaonline.com/image/0e80e68d525d87d1b722d1150abda18cecb8f684.svg)
e otteniamo:
0.95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1.96 ≤ X ¯ - μ σ / n ≤ 1.96 ) = P ( X ¯ - 1.96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1.96 × 0.5 ≤ μ ≤ X ¯ + 1.96 × 0.5 ) = P ( X ¯ - 0.98 ≤ μ ≤ X ¯ + 0.98 ) . 0,95&=1-alpha =P(-zleq Zleq z)=P\sinistra(-1,96\leq {frac {{barra {X}-\mu }{sigma /{sqrt {n}}}}\leq 1.96\destra)&=P\sinistra({{barra {X}-1,96{frac {sigma /{sqrt {n}}}leq \mu \leq {\mu \leq \barra {X}+1.96{frac {sigma }{sqrt {n}} a destra)\[6pt]&=P\sinistra({{barra {X}}-1,96{ 0,5 volte 0,5{mu \leq {X}}+1.96 per 0,5 volte a destra)\\[6pt]&=P\sinistra({\barra {X}}-0,98\leq \mu \leq {\barra {X}+0,98 a destra).\end{aligned}} ![{\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}](https://www.alegsaonline.com/image/2437ee6c7c0320fa30cec1de64773a6e7cc3a095.svg)
Questo potrebbe essere interpretato come: con probabilità 0,95 troveremo un intervallo di confidenza in cui incontreremo il parametro μ tra gli endpoint stocastici
X ¯ - 0 . 98 {displaystyle {{barra {X}-0{.}98,} 
e
X ¯ + 0.98. X + 0,98. 
Questo non significa che ci sia una probabilità dello 0,95 di incontrare il parametro μ nell'intervallo calcolato. Ogni volta che le misurazioni vengono ripetute, ci sarà un altro valore per la media X del campione. Nel 95% dei casi μ sarà tra i punti finali calcolati da questa media, ma nel 5% dei casi non lo sarà. L'intervallo di confidenza reale è calcolato inserendo i pesi misurati nella formula. Il nostro intervallo di confidenza 0,95 diventa:
( x ¯ - 0.98 ; x ¯ + 0.98 ) = ( 250.2 - 0.98 ; 250.2 + 0.98 ) = ( 249.22 ; 251.18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} 
Poiché il valore desiderato 250 di μ è all'interno dell'intervallo di confidenza risultante, non c'è motivo di credere che la macchina sia calibrata male.
L'intervallo calcolato ha punti finali fissi, dove μ potrebbe trovarsi nel mezzo (o no). Quindi questo evento ha probabilità 0 o 1. Non possiamo dire: "con probabilità (1 - α) il parametro μ si trova nell'intervallo di confidenza". Sappiamo solo che per ripetizione nel 100(1 - α) % dei casi μ sarà nell'intervallo calcolato. Nel 100α % dei casi però non lo fa. E purtroppo non sappiamo in quale dei casi questo accade. Ecco perché diciamo: "con livello di confidenza 100(1 - α) %, μ si trova nell'intervallo di confidenza. "
La figura a destra mostra 50 realizzazioni di un intervallo di confidenza per una data media della popolazione μ. Se scegliamo a caso una realizzazione, la probabilità è del 95% che finiamo per aver scelto un intervallo che contiene il parametro; tuttavia potremmo essere sfortunati e aver scelto quello sbagliato. Non lo sapremo mai; siamo bloccati con il nostro intervallo.