Distribuzione di frequenza
In statistica, una distribuzione di frequenza è una lista dei valori che una variabile assume in un campione. Di solito è una lista ordinata per quantità. Mostrerà il numero di volte che ogni valore appare. Per esempio, se 100 persone valutano su una scala Likert a cinque punti il loro accordo con una dichiarazione su una scala in cui 1 denota forte accordo e 5 forte disaccordo, la distribuzione di frequenza delle loro risposte potrebbe apparire come:
Questa semplice tabella ha due svantaggi. Quando una variabile può assumere valori continui invece che discreti o quando il numero di valori possibili è troppo grande, la costruzione della tabella è difficile, se non impossibile. In questi casi si usa uno schema leggermente diverso basato sull'intervallo di valori. Per esempio, se consideriamo le altezze degli studenti in una classe, la tabella di frequenza potrebbe apparire come segue.
Esempio di distribuzione di frequenza (assoluta). Questa è la piramide della popolazione dell'Angola, per l'anno 2005.
Questa è la piramide della popolazione cinese per l'anno 2005.
Applicazioni
Gestire e operare su dati tabulati di frequenza è molto più semplice che operare su dati grezzi. Ci sono semplici algoritmi per calcolare mediana, media (statistica), deviazione standard ecc. da queste tabelle.
Il test delle ipotesi statistiche si basa sulla valutazione delle differenze e delle somiglianze tra le distribuzioni di frequenza. Questa valutazione coinvolge misure di tendenza centrale o medie, come la media e la mediana, e misure di variabilità o dispersione statistica, come la deviazione standard o la varianza.
Si dice che una distribuzione di frequenza è obliqua quando la sua media e la sua mediana sono diverse. La curtosi di una distribuzione di frequenza è la concentrazione di punteggi in corrispondenza della media, o come appare il picco della distribuzione se rappresentata graficamente, per esempio in un istogramma. Se la distribuzione ha più picchi rispetto alla distribuzione normale, si dice che è leptocurtica; se ha meno picchi, si dice che è platinocurtica.
Le distribuzioni di frequenza sono anche usate nell'analisi di frequenza per decifrare i codici e si riferiscono alla frequenza relativa delle lettere in diverse lingue.
Domande e risposte
D: Che cos'è una distribuzione di frequenza?
R: Una distribuzione di frequenza è un elenco dei valori che una variabile assume in un campione, ordinati per quantità. Mostra quante volte appare ogni valore.
D: Come potrebbe apparire la distribuzione di frequenza delle risposte a una scala Likert a cinque punti?
R: La distribuzione di frequenza delle risposte a una scala Likert a cinque punti potrebbe apparire come una semplice tabella che mostra il numero di persone che hanno valutato ogni punto della scala.
D: Quali sono i due inconvenienti dell'utilizzo di questo tipo di tabella?
R: Due inconvenienti nell'utilizzo di questo tipo di tabella sono che può essere difficile o addirittura impossibile quando si tratta di valori continui o quando ci sono troppi valori possibili.
D: In che modo questo schema è diverso quando si tratta di valori continui o di un gran numero di valori possibili?
R: Quando si tratta di valori continui o di un gran numero di valori possibili, si può utilizzare uno schema leggermente diverso, basato sull'intervallo di valori.
D: Come potrebbe apparire la tabella di frequenza per le altezze degli studenti?
R: La tabella di frequenza per l'altezza degli studenti potrebbe mostrare gli intervalli e il numero di studenti che rientrano in ciascun intervallo.
D: Quali informazioni fornisce la distribuzione di frequenza?
R: La distribuzione di frequenza fornisce informazioni sulla frequenza con cui certe variabili appaiono nei campioni e su come sono distribuite in questi campioni.