Errore standard
L'errore standard è la deviazione standard della distribuzione di campionamento di una statistica. Il termine può anche essere usato per una stima (buona ipotesi) di quella deviazione standard presa da un campione dell'intero gruppo.
La media di una parte di un gruppo (chiamata campione) è il modo usuale per stimare la media di tutto il gruppo. Spesso è troppo difficile o costa troppo denaro misurare l'intero gruppo. Ma se si misura un altro campione, questo avrà una media che è un po' diversa da quella del primo campione. L'errore standard della media è un modo per sapere quanto la media del campione sia vicina alla media dell'intero gruppo. È un modo per sapere quanto si può essere sicuri della media del campione.
Nelle misurazioni reali, il vero valore della deviazione standard della media per l'intero gruppo di solito non è noto. Quindi il termine errore standard è spesso usato per indicare un'ipotesi vicina al numero vero per l'intero gruppo. Più misurazioni ci sono in un campione, più vicino sarà l'ipotesi al numero vero per l'intero gruppo.
Per un valore che viene campionato con un errore non distorto e distribuito normalmente, quanto sopra rappresenta la proporzione di campioni che cadrebbe tra 0, 1, 2 e 3 deviazioni standard sopra e sotto il valore reale.
Come trovare l'errore standard della media
Un modo per trovare l'errore standard della media è avere molti campioni. Prima si trova la media di ogni campione. Poi si trova la media e la deviazione standard delle medie di questi campioni. La deviazione standard per tutte le medie dei campioni è l'errore standard della media. Questo può essere un sacco di lavoro. A volte è troppo difficile o costa troppo denaro avere molti campioni.
Un altro modo per trovare l'errore standard della media è quello di usare un'equazione che ha bisogno di un solo campione. L'errore standard della media è solitamente stimato dalla deviazione standard per un campione dall'intero gruppo (deviazione standard del campione) diviso per la radice quadrata della dimensione del campione.
S E x ¯ = s n {displaystyle SE_{{bar {x}}} ={frac {s}{sqrt {n}}}}
dove
s è la deviazione standard del campione (cioè la stima basata sul campione della deviazione standard della popolazione), e
n è il numero di misurazioni nel campione.
Quanto deve essere grande il campione in modo che la stima dell'errore standard della media sia vicina all'effettivo errore standard della media per l'intero gruppo? Ci dovrebbero essere almeno sei misurazioni in un campione. Allora l'errore standard della media per il campione sarà entro il 5% dell'errore standard della media se l'intero gruppo fosse misurato.
Correzioni per alcuni casi
C'è un'altra equazione da usare se il numero di misure è per il 5% o più dell'intero gruppo:
Ci sono equazioni speciali da usare se un campione ha meno di 20 misurazioni.
A volte un campione proviene da un solo luogo anche se l'intero gruppo può essere sparso. Inoltre, a volte un campione può essere fatto in un breve periodo di tempo quando l'intero gruppo copre un tempo più lungo. In questo caso, i numeri nel campione non sono indipendenti. Allora si usano equazioni speciali per cercare di correggere questo fatto.
Utilità
Un risultato pratico: Si può diventare più sicuri di un valore medio avendo più misurazioni in un campione. Allora l'errore standard della media sarà più piccolo perché la deviazione standard è divisa per un numero maggiore. Tuttavia, per rendere l'incertezza (errore standard della media) in un valore medio grande la metà, la dimensione del campione (n) deve essere quattro volte maggiore. Questo perché la deviazione standard è divisa per la radice quadrata della dimensione del campione. Per rendere l'incertezza grande un decimo, la dimensione del campione (n) deve essere cento volte più grande!
Gli errori standard sono facili da calcolare e sono molto usati perché:
- Se l'errore standard di diverse quantità individuali è noto, allora l'errore standard di qualche funzione delle quantità può essere facilmente calcolato in molti casi;
- Quando la distribuzione di probabilità del valore è nota, può essere usata per calcolare una buona approssimazione a un intervallo di confidenza esatto; e
- Quando la distribuzione di probabilità non è nota, altre equazioni possono essere utilizzate per stimare un intervallo di confidenza
- Quando la dimensione del campione diventa molto grande, il principio del teorema del limite centrale mostra che i numeri del campione sono molto simili ai numeri dell'intero gruppo (hanno una distribuzione normale).
Errore standard relativo
L'errore standard relativo (RSE) è l'errore standard diviso per la media. Questo numero è più piccolo di uno. Moltiplicandolo per 100% lo si ottiene come percentuale della media. Questo aiuta a mostrare se l'incertezza è importante o meno. Per esempio, consideriamo due sondaggi sul reddito familiare che risultano entrambi in una media campionaria di 50.000 dollari. Se un sondaggio ha un errore standard di 10.000 dollari e l'altro ha un errore standard di 5.000 dollari, allora gli errori standard relativi sono rispettivamente del 20% e del 10%. Il sondaggio con l'errore standard relativo più basso è migliore perché ha una misurazione più precisa (l'incertezza è minore).
Infatti, le persone che hanno bisogno di conoscere i valori medi spesso decidono quanto piccola debba essere l'incertezza prima di decidere di usare l'informazione. Per esempio, il National Center for Health Statistics degli Stati Uniti non riporta una media se l'errore standard relativo supera il 30%. L'NCHS richiede anche almeno 30 osservazioni per riportare una stima. []
Esempio
Per esempio, ci sono molti scorfani nelle acque del Golfo del Messico. Per sapere quanto pesa in media uno scorfano di 42 cm di lunghezza, non è possibile misurare tutti gli scorfani che sono lunghi 42 cm. Invece, è possibile misurarne alcuni. I pesci che vengono effettivamente misurati sono chiamati campioni. La tabella mostra i pesi di due campioni di scorfani, tutti lunghi 42 cm. Il peso medio del primo campione è di 0,741 kg. Il peso medio del secondo campione è di 0,735 kg, un po' diverso dal primo campione. Ognuna di queste medie è un po' diversa dalla media che si otterrebbe misurando ogni scorfano di 42 cm di lunghezza (il che non è comunque possibile).
L'incertezza della media può essere usata per sapere quanto la media dei campioni sia vicina alla media che verrebbe dalla misurazione dell'intero gruppo. L'incertezza della media è stimata come la deviazione standard per il campione, divisa per la radice quadrata del numero di campioni meno uno. La tabella mostra che le incertezze nelle medie per i due campioni sono molto vicine tra loro. Inoltre, l'incertezza relativa è l'incertezza nella media divisa per la media, per il 100%. L'incertezza relativa in questo esempio è del 2,38% e del 2,50% per i due campioni.
Conoscendo l'incertezza nella media, si può sapere quanto la media del campione è vicina alla media che verrebbe dalla misurazione dell'intero gruppo. La media dell'intero gruppo è compresa tra a) la media del campione più l'incertezza della media e b) la media del campione meno l'incertezza della media. In questo esempio, il peso medio per tutti gli scorfani di 42 cm di lunghezza nel Golfo del Messico dovrebbe essere 0,723-0,759 kg sulla base del primo campione, e 0,717-0,753 sulla base del secondo campione.
Esempio di uno scorfano (noto anche come tamburo rosso, Sciaenops ocellatus) utilizzato nell'esempio.
Domande e risposte
D: Che cos'è l'errore standard?
R: L'errore standard è la deviazione standard della distribuzione di campionamento di una statistica.
D: Il termine errore standard può essere utilizzato per una stima della deviazione standard?
R: Sì, il termine errore standard può essere utilizzato per una stima (una buona ipotesi) di quella deviazione standard presa da un campione dell'intero gruppo.
D: Come si stima la media di un intero gruppo?
R: La media di una parte di un gruppo (chiamata campione) è il modo abituale per stimare la media dell'intero gruppo.
D: Perché è difficile misurare l'intero gruppo?
R: Spesso è troppo difficile o troppo costoso misurare l'intero gruppo.
D: Cos'è l'errore standard della media e cosa determina?
R: L'errore standard della media è un modo per sapere quanto la media del campione è vicina alla media dell'intero gruppo. È un modo per sapere quanto si può essere sicuri della media del campione.
D: Il valore reale della deviazione standard della media è solitamente noto nelle misurazioni reali?
R: No, il valore reale della deviazione standard della media per l'intero gruppo di solito non è noto nelle misurazioni reali.
D: In che modo il numero di misurazioni in un campione influisce sull'accuratezza della stima?
R: Più misurazioni ci sono in un campione, più la stima sarà vicina al numero vero per l'intero gruppo.