Paradosso di Simpson

Il paradosso di Simpson è un paradosso della statistica. Prende il nome da Edward H. Simpson, uno statistico britannico che lo descrisse per la prima volta nel 1951. Lo statistico Karl Pearson ha descritto un effetto molto simile nel 1899.- La descrizione di Udny Yule risale al 1903. A volte viene chiamato effetto Yule-Simpson. Quando si guardano i punteggi statistici dei gruppi, questi punteggi possono cambiare, a seconda che i gruppi siano guardati uno per uno, o se sono combinati in un gruppo più grande. Questo caso si verifica spesso nelle scienze sociali e nelle statistiche mediche. Può confondere le persone, se i dati di frequenza sono usati per spiegare una relazione causale. Altri nomi per il paradosso includono il paradosso dell'inversione e il paradosso dell'amalgama.

Esempio: Trattamento dei calcoli renali

Questo è un esempio reale di uno studio medico che confronta le percentuali di successo di due trattamenti per i calcoli renali.

La tabella mostra le percentuali di successo e il numero di trattamenti per i trattamenti di calcoli renali piccoli e grandi, dove il trattamento A include tutte le procedure aperte e il trattamento B è la nefrolitotomia percutanea:

Trattamento A

Trattamento B

successo

fallimento

successo

fallimento

Piccole pietre

Gruppo 1

Gruppo 2

numero di pazienti

81

6

234

36

93%

7%

87%

13%

Pietre grandi

Gruppo 3

Gruppo 4

numero di pazienti

192

71

55

25

73%

27%

69%

31%

Entrambi

Gruppo 1+3

Gruppo 2+4

numero di pazienti

273

77

289

61

78%

22%

83%

17%

La conclusione paradossale è che il trattamento A è più efficace se usato su calcoli piccoli e anche se usato su calcoli grandi, ma il trattamento B è più efficace se si considerano entrambe le dimensioni allo stesso tempo. In questo esempio, non si sapeva che la dimensione del calcolo renale influenzava il risultato. Questo è chiamato variabile nascosta (o variabile in agguato) in statistica.

Quale trattamento è considerato migliore è determinato da una disuguaglianza tra due rapporti (successi/totale). L'inversione della disuguaglianza tra i rapporti, che crea il paradosso di Simpson, avviene perché due effetti si verificano insieme:

  1. Le dimensioni dei gruppi, che sono combinati quando si ignora la variabile in agguato, sono molto diverse. I medici tendono a dare ai casi gravi (calcoli grandi) il trattamento migliore (A), e ai casi più lievi (calcoli piccoli) il trattamento inferiore (B). Pertanto, i totali sono dominati dai gruppi tre e due, e non dai due gruppi molto più piccoli uno e quattro.
  2. La variabile "lurking" ha un grande effetto sui rapporti, cioè la percentuale di successo è più fortemente influenzata dalla gravità del caso che dalla scelta del trattamento. Pertanto, il gruppo di pazienti con grossi calcoli che utilizzano il trattamento A (gruppo tre) fa peggio del gruppo con piccoli calcoli, anche se quest'ultimo ha utilizzato il trattamento inferiore B (gruppo due).

AlegsaOnline.com - 2020 / 2023 - License CC3