Distribuzione t di Student
La distribuzione delle t degli studenti è una distribuzione di probabilità che è stata sviluppata da William Sealy Gosset nel 1908. Studente è lo pseudonimo che ha usato quando ha pubblicato l'articolo che descrive la distribuzione. Gosset lavorava in una fabbrica di birra ed era interessato ai problemi dei piccoli campioni, per esempio alle proprietà chimiche dell'orzo. Nei problemi che analizzava, la dimensione del campione poteva essere anche di tre. Una versione dell'origine dello pseudonimo è che il datore di lavoro di Gosset preferiva che il personale di Gosset usasse nomi di penna quando pubblicava documenti scientifici invece del loro vero nome, così ha usato il nome "Studente" per nascondere la sua identità. Un'altra versione è che il birrificio non voleva che i concorrenti sapessero che stavano usando il t-test per testare la qualità della materia prima.
A causa delle piccole dimensioni del campione, non è possibile stimare la deviazione standard. Inoltre, in molti casi incontrati da Gosset, la distribuzione di probabilità dei campioni non era nota.
Una distribuzione normale descrive una popolazione completa, le distribuzioni t descrivono campioni prelevati da una popolazione completa; di conseguenza, la distribuzione t per ogni dimensione del campione è diversa, e più grande è il campione, più la distribuzione assomiglia ad una distribuzione normale.
La distribuzione t svolge un ruolo in molte analisi statistiche ampiamente utilizzate, tra cui il t-test dello Studente per valutare la significatività statistica della differenza tra due mezzi del campione, la costruzione di intervalli di confidenza per la differenza tra due mezzi della popolazione e nell'analisi di regressione lineare. La distribuzione t dello Studente sorge anche nell'analisi bayesiana dei dati di una famiglia normale.
Se prendiamo un campione di n osservazioni da una distribuzione normale, allora la distribuzione t con ν = n-1 gradi di libertà può essere definita come la distribuzione della posizione della media reale, relativa alla media del campione e divisa per la deviazione standard del campione, dopo averla moltiplicata per il termine normalizzante n {\sqrt {n}}}}}. . In questo modo, la distribuzione t può essere utilizzata per stimare quanto è probabile che la vera media si trovi in un determinato intervallo.
La distribuzione a t è simmetrica e a campana, come la distribuzione normale, ma ha code più pesanti, il che significa che è più incline a produrre valori che si discostano dalla sua media. Ciò la rende utile per comprendere il comportamento statistico di certi tipi di rapporti di quantità casuali, in cui la variazione del denominatore è amplificata e può produrre valori fuori scala quando il denominatore del rapporto scende vicino allo zero. La distribuzione t dello Studente è un caso particolare della distribuzione iperbolica generalizzata.
Domande e risposte
D: Cos'è la distribuzione t di Student?
R: La distribuzione t di Student è una distribuzione di probabilità sviluppata da William Sealy Gosset nel 1908. Descrive campioni estratti da una popolazione completa, e più grande è la dimensione del campione, più assomiglia a una distribuzione normale.
D: Chi ha sviluppato la distribuzione t di Student?
R: William Sealy Gosset ha sviluppato la distribuzione t di Student nel 1908. Usò lo pseudonimo di "Student" quando pubblicò l'articolo che la descriveva.
D: Quali sono alcuni degli usi della distribuzione t di Student?
R: La distribuzione t di Student svolge un ruolo in molte analisi statistiche ampiamente utilizzate, tra cui il test t di Student per valutare la significatività statistica delle differenze tra due medie del campione, la costruzione di intervalli di confidenza per le differenze tra due medie della popolazione e l'analisi di regressione lineare. Si presenta anche nell'analisi bayesiana dei dati di una famiglia normale.
D: In che modo la dimensione del campione influisce sulla forma della distribuzione t?
R: Più grande è la dimensione del campione, più assomiglierà a una distribuzione normale. Per ogni diversa dimensione del campione c'è un'unica distribuzione t associata che lo descrive.
D: Esiste una relazione tra la distribuzione T di Student e la distribuzione normale?
R: Sì - mentre le distribuzioni normali descrivono popolazioni complete, le Distribuzioni T di Student descrivono campioni estratti da tali popolazioni; come tali, condividono somiglianze ma differiscono a seconda delle rispettive dimensioni. Come già detto, i campioni più grandi tendono ad assomigliare di più alle distribuzioni normali rispetto a quelli più piccoli.
D: Esiste un altro nome per questo tipo di distribuzione?
R: No, questo tipo di distribuzione è noto come "Distribuzione T di Student", dal nome del suo ideatore William Sealy Gosset, che usò lo pseudonimo di "Student" quando pubblicò il suo articolo al riguardo.