Legge di Zipf

Autore: Leandro Alegsa

17-01-2021 14:42

La legge di Zipf è una legge empirica, formulata utilizzando la statistica matematica, che prende il nome dal linguista George Kingsley Zipf, che per primo la propose.

La legge di Zipf stabilisce che, dato un ampio campione di parole utilizzate, la frequenza di qualsiasi parola è inversamente proporzionale al suo rango nella tabella delle frequenze. Quindi la parola numero n ha una frequenza proporzionale a 1/n.

Così la parola più frequente sarà circa il doppio della seconda parola più frequente, tre volte più frequente della terza parola più frequente, ecc. Ad esempio, in un campione di parole in lingua inglese, la parola più frequente, "the", rappresenta quasi il 7% di tutte le parole (69.971 su poco più di 1 milione). Secondo la legge di Zipf, la parola "di", al secondo posto, rappresenta poco più del 3,5% delle parole (36.411 occorrenze), seguita da "e" (28.852). Sono necessarie solo circa 135 parole per rappresentare la metà del campione di parole di un vasto campione.

La stessa relazione si verifica in molte altre classifiche, non correlate alla lingua, come le classifiche della popolazione delle città in vari paesi, le dimensioni delle società, le classifiche dei redditi, ecc. La comparsa della distribuzione in classifiche delle città per popolazione è stata notata per la prima volta da Felix Auerbach nel 1913.

Non si sa perché la legge di Zipf vale per la maggior parte delle lingue.

Domande e risposte

D: Cos'è la legge di Zipf?

R: La legge di Zipf è una legge empirica che afferma che la frequenza di una parola in un ampio campione è inversamente proporzionale al suo rango nella tabella di frequenza.

D: Chi ha proposto la legge di Zipf?

R: La legge di Zipf è stata proposta per la prima volta da George Kingsley Zipf, un linguista.

D: Come spiega la legge di Zipf la frequenza delle parole in un campione di parole inglesi?

R: Secondo la legge di Zipf, la parola più frequente in un campione di parole inglesi si verifica circa due volte più spesso della seconda parola più frequente, tre volte più spesso della terza parola più frequente, ecc. Questa tendenza continua quando il rango della parola diminuisce.

D: Quale percentuale di tutte le parole rappresenta la parola più frequente in un campione di parole inglesi?

R: In un campione di parole inglesi, la parola più frequente ("il") rappresenta quasi il 7% di tutte le parole.

D: Qual è la relazione tra il numero di parole necessarie per rappresentare la metà del campione e la frequenza di tali parole?

R: Secondo la legge di Zipf, sono necessarie solo circa 135 parole per rappresentare la metà del campione di parole in un campione ampio.

D: Quali altre classificazioni mostrano la legge di Zipf?

R: La stessa relazione che la legge di Zipf descrive nella frequenza delle parole si verifica in altre classifiche non correlate al linguaggio, come le classifiche della popolazione delle città in vari Paesi, le dimensioni delle aziende e le classifiche del reddito.

D: Chi ha notato la comparsa della distribuzione nelle classifiche delle città in base alla popolazione?

R: La comparsa della distribuzione nelle classifiche delle città in base alla popolazione è stata notata per la prima volta da Felix Auerbach nel 1913.

Cerca nell'enciclopedia