I test del QI sono rinormalizzati ogni tanto per mantenere il punteggio medio per un gruppo di età a 100. Questo ha dato un primo indizio a Flynn che il QI stava cambiando nel tempo. Le versioni riviste sono standardizzate su nuovi campioni e valutate solo rispetto a quei campioni. L'unico modo per confrontare la difficoltà di due versioni è quello di avere un gruppo di persone che fanno entrambi i test. Questo conferma i guadagni del QI nel tempo.
Il tasso medio di aumento sembra essere di circa tre punti di QI per decennio. Oggi i bambini vanno a scuola più a lungo. Hanno anche acquisito una maggiore familiarità con i test. Ci si potrebbe quindi aspettare che i maggiori guadagni si verifichino con contenuti legati alla scuola, come il vocabolario, l'aritmetica o le informazioni generali. È proprio il contrario: abilità come queste hanno avuto piccoli guadagni e occasionali diminuzioni nel corso degli anni. I più grandi cambiamenti appaiono invece sui test di intelligenza generale caricati a fattori (g-loaded) come le matrici progressive di Raven. Per esempio, i soldati olandesi hanno guadagnato 21 punti in soli 30 anni, o 7 punti per decennio, tra il 1952 e il 1982.
Alcuni studi concentrati sulla distribuzione dei punteggi hanno trovato che l'effetto Flynn si verifica principalmente con i punteggi più bassi. Tuttavia, Raven (2000) ha scoperto che molti dati devono essere reinterpretati rispetto alla data di nascita. In precedenza, questi dati erano stati interpretati per mostrare che molte abilità diminuiscono quando le persone invecchiano. Ora questi dati devono essere interpretati per mostrare che molte abilità sono in realtà aumentate drasticamente, come Flynn aveva previsto. In molti test questo si verifica a tutti i livelli di abilità. Due grandi campioni di bambini spagnoli sono stati valutati con un intervallo di 30 anni. Il confronto delle distribuzioni del QI ha indicato che
- il QI medio era aumentato di 9,7 punti (effetto Flynn),
- i guadagni erano concentrati nella metà inferiore della distribuzione e trascurabili nella metà superiore, e
- i guadagni sono diminuiti gradualmente dal basso all'alto QI.
Alcuni scienziati credono che questi cambiamenti siano molto grandi. Uno di loro è Ulric Neisser. Nel 1995 era a capo di una task force dell'American Psychological Association, incaricata di scrivere una dichiarazione su dove fosse la ricerca sull'intelligenza. Egli stima che se i bambini americani del 1932 avessero potuto fare un test del QI normalizzato nel 1997, il loro QI medio sarebbe stato solo circa 80. In altre parole, la metà dei bambini del 1932 sarebbe classificata come avente un ritardo mentale borderline o peggiore nel 1997. Guardando Ravens, Neisser stima che se si estrapola oltre i dati, che mostrano un guadagno di 21 punti tra il 1952 e il 1982, si può sostenere un guadagno ancora maggiore di 35 punti di QI. Arthur Jensen avverte che estrapolare oltre i dati porta a risultati come un QI di meno 1000 per Aristotele (anche supponendo che avrebbe ottenuto 200 punti ai suoi tempi).
Il più delle volte, l'effetto è associato a un aumento del QI. Un effetto simile è stato trovato con aumenti della memoria semantica ed episodica.