Intervallo di confidenza

Autore: Leandro Alegsa

28-02-2021 21:11

In statistica un intervallo di confidenza è una forma speciale di stima di un certo parametro. Con questo metodo, viene dato un intero intervallo di valori accettabili per il parametro invece di un singolo valore, insieme alla probabilità che il valore reale (sconosciuto) del parametro sia nell'intervallo. L'intervallo di confidenza si basa sulle osservazioni di un campione, e quindi differisce da campione a campione. La probabilità che il parametro sia nell'intervallo è chiamata livello di confidenza. Molto spesso, questo è dato come percentuale. L'intervallo di confidenza è sempre dato insieme al livello di confidenza. Si può parlare di "intervallo di confidenza al 95%". I punti finali dell'intervallo di confidenza sono chiamati limiti di confidenza. Per una data procedura di stima in una data situazione, più alto è il livello di confidenza, più ampio sarà l'intervallo di confidenza.

Il calcolo di un intervallo di confidenza richiede generalmente ipotesi sulla natura del processo di stima - è principalmente un metodo parametrico. Un presupposto comune è che la distribuzione della popolazione da cui proviene il campione sia normale. Come tale, gli intervalli di confidenza, come discusso di seguito, non sono statistiche robuste, anche se possono essere apportate modifiche per aggiungere robustezza.

Significato del termine "fiducia"

Il termine fiducia ha un significato simile in statistica, come nell'uso comune. Nell'uso comune, un'affermazione del 95% di fiducia in qualcosa viene normalmente presa come un'indicazione di certezza virtuale. In statistica, un'affermazione di fiducia al 95% significa semplicemente che il ricercatore ha visto un intervallo possibile da un gran numero di possibili intervalli, dai quali diciannove su venti intervalli contengono il vero valore del parametro.

Esempio pratico

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Una macchina riempie delle tazze di margarina. Per l'esempio, la macchina è regolata in modo che il contenuto delle tazze sia di 250 g di margarina. Poiché la macchina non può riempire ogni tazza esattamente con 250 g, il contenuto aggiunto alle singole tazze mostra una certa variazione, ed è considerato una variabile casuale X. Questa variazione si assume essere normalmente distribuita intorno alla media desiderata di 250 g, con una deviazione standard di 2,5 g. Per determinare se la macchina è adeguatamente calibrata, un campione di n = 25 tazze di margarina viene scelto a caso e le tazze vengono pesate. I pesi della margarina sono X1, ..., X25, un campione casuale di X.

Per avere un'impressione dell'aspettativa μ, è sufficiente dare una stima. Lo stimatore appropriato è la media del campione:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {displaystyle {{hat {\mu }}={{barra {X}}={frac {1}{n}}}sum _{i=1}^{n}X_{i}. } ${\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.$

Il campione mostra i pesi reali x1, ...,x25, con la media:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 grammi . {displaystyle {bar {x}}={frac {1}{25}}}sum _{i=1}^{25}x_{i}=250,2\, {text{grammi}}. } ${\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.$

Se prendiamo un altro campione di 25 tazze, potremmo facilmente aspettarci di trovare valori come 250,4 o 251,1 grammi. Un valore medio del campione di 280 grammi sarebbe però estremamente raro se il contenuto medio delle tazze è in effetti vicino a 250g. C'è un intero intervallo intorno al valore osservato 250,2 della media del campione all'interno del quale, se l'intera media della popolazione assume effettivamente un valore in questo intervallo, i dati osservati non sarebbero considerati particolarmente insoliti. Un tale intervallo è chiamato intervallo di confidenza per il parametro μ. Come si calcola un tale intervallo? Gli estremi dell'intervallo devono essere calcolati a partire dal campione, quindi sono statistiche, funzioni del campione X1, ..., X25 e quindi variabili casuali esse stesse.

Nel nostro caso possiamo determinare i punti finali considerando che la media campionaria X da un campione normalmente distribuito è anche normalmente distribuita, con la stessa aspettativa μ, ma con errore standard σ/√n = 0,5 (grammi). Standardizzando otteniamo una variabile casuale

Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {displaystyle Z={frac {{barra {X}}-\mu }{sigma /{sqrt {n}}}}={frac {{barra {X}}-\mu }{0.5}} $Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}$

dipendente dal parametro μ da stimare, ma con una distribuzione normale standard indipendente dal parametro μ. Quindi è possibile trovare numeri -z e z, indipendenti da μ, dove Z sta in mezzo con probabilità 1 - α, una misura di quanto vogliamo essere fiduciosi. Prendiamo 1 - α = 0,95. Quindi abbiamo:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. P(-z ≤ Z ≤ z)=1-\alpha =0,95. $P(-z\leq Z\leq z)=1-\alpha =0.95.\,$

Il numero z segue dalla funzione di distribuzione cumulativa:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0.975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0.975 ) = 1.96 , {displaystyle {begin{aligned}\Phi (z)&=P(Z\leq z)=1-{tfrac {alpha }{2}}=0,975,\\\[6pt]z&=Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0,975)=1,96,\end{aligned}}} ${\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}$

e otteniamo:

0.95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1.96 ≤ X ¯ - μ σ / n ≤ 1.96 ) = P ( X ¯ - 1.96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1.96 × 0.5 ≤ μ ≤ X ¯ + 1.96 × 0.5 ) = P ( X ¯ - 0.98 ≤ μ ≤ X ¯ + 0.98 ) . 0,95&=1-alpha =P(-zleq Zleq z)=P\sinistra(-1,96\leq {frac {{barra {X}-\mu }{sigma /{sqrt {n}}}}\leq 1.96\destra)&=P\sinistra({{barra {X}-1,96{frac {sigma /{sqrt {n}}}leq \mu \leq {\mu \leq \barra {X}+1.96{frac {sigma }{sqrt {n}} a destra)\[6pt]&=P\sinistra({{barra {X}}-1,96{ 0,5 volte 0,5{mu \leq {X}}+1.96 per 0,5 volte a destra)\\[6pt]&=P\sinistra({\barra {X}}-0,98\leq \mu \leq {\barra {X}+0,98 a destra).\end{aligned}} ${\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}$

Questo potrebbe essere interpretato come: con probabilità 0,95 troveremo un intervallo di confidenza in cui incontreremo il parametro μ tra gli endpoint stocastici

X ¯ - 0 . 98 {displaystyle {{barra {X}-0{.}98,} ${\bar {X}}-0{.}98\,$

X ¯ + 0.98. X + 0,98. ${\bar {X}}+0.98.\,$

Questo non significa che ci sia una probabilità dello 0,95 di incontrare il parametro μ nell'intervallo calcolato. Ogni volta che le misurazioni vengono ripetute, ci sarà un altro valore per la media X del campione. Nel 95% dei casi μ sarà tra i punti finali calcolati da questa media, ma nel 5% dei casi non lo sarà. L'intervallo di confidenza reale è calcolato inserendo i pesi misurati nella formula. Il nostro intervallo di confidenza 0,95 diventa:

( x ¯ - 0.98 ; x ¯ + 0.98 ) = ( 250.2 - 0.98 ; 250.2 + 0.98 ) = ( 249.22 ; 251.18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} $({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,$

Poiché il valore desiderato 250 di μ è all'interno dell'intervallo di confidenza risultante, non c'è motivo di credere che la macchina sia calibrata male.

L'intervallo calcolato ha punti finali fissi, dove μ potrebbe trovarsi nel mezzo (o no). Quindi questo evento ha probabilità 0 o 1. Non possiamo dire: "con probabilità (1 - α) il parametro μ si trova nell'intervallo di confidenza". Sappiamo solo che per ripetizione nel 100(1 - α) % dei casi μ sarà nell'intervallo calcolato. Nel 100α % dei casi però non lo fa. E purtroppo non sappiamo in quale dei casi questo accade. Ecco perché diciamo: "con livello di confidenza 100(1 - α) %, μ si trova nell'intervallo di confidenza. "

La figura a destra mostra 50 realizzazioni di un intervallo di confidenza per una data media della popolazione μ. Se scegliamo a caso una realizzazione, la probabilità è del 95% che finiamo per aver scelto un intervallo che contiene il parametro; tuttavia potremmo essere sfortunati e aver scelto quello sbagliato. Non lo sapremo mai; siamo bloccati con il nostro intervallo.

I segmenti di linea verticale rappresentano 50 realizzazioni di un intervallo di confidenza per μ.

Domande e risposte

D: Che cos'è un intervallo di confidenza nelle statistiche?

R: Un intervallo di confidenza è un intervallo speciale utilizzato per stimare un parametro, come la media della popolazione, fornendo una gamma di valori accettabili per il parametro invece di un singolo valore.

D: Perché si utilizza un intervallo di confidenza invece di un singolo valore?

R: Un intervallo di confidenza viene utilizzato al posto di un valore singolo per tenere conto dell'incertezza della stima di un parametro basata su un campione e per fornire una probabilità che il valore reale del parametro sia all'interno dell'intervallo.

D: Che cos'è un livello di confidenza?

R: Un livello di confidenza è la probabilità che il parametro stimato rientri nell'intervallo di confidenza, e spesso viene indicato come percentuale (ad esempio, intervallo di confidenza del 95%).

D: Cosa sono i limiti di confidenza?

R: I limiti di confidenza sono i punti finali di un intervallo di confidenza, che definiscono la gamma di valori accettabili per il parametro stimato.

D: In che modo il livello di confidenza influisce sull'intervallo di confidenza?

R: In una determinata procedura di stima, più alto è il livello di confidenza, più ampio sarà l'intervallo di confidenza.

D: Quali presupposti sono necessari per calcolare un intervallo di confidenza?

R: Il calcolo di un intervallo di confidenza richiede generalmente delle ipotesi sulla natura del processo di stima, come l'ipotesi che la distribuzione della popolazione da cui proviene il campione sia normale.

D: Gli intervalli di confidenza sono statistiche robuste?

R: Gli intervalli di confidenza, come discusso di seguito, non sono statistiche robuste, anche se è possibile apportare modifiche per aggiungere robustezza.

Cerca nell'enciclopedia