Il paradosso di Simpson è un paradosso che mostra i pericoli dell’applicazione ingenua della statistica. L’idea è illustrata nelle due figure seguenti:
In questo caso abbiamo due gruppi di punti nel grafico, entrambi con una correlazione positiva tra la variabile $x$ e la variabile $y$. Tuttavia disegnando una linea di regressione che include entrambi i punti si direbbe che la correlazione tra $x$ e $y$ è in totale negativa. Un esempio più simile alla vita reale è illustrato nella figura seguente:
In questo caso abbiamo di nuovo dei dati che nella loro totalità mostrano una correlazione negativa tra $x$ e $y$, mentre se appropriatamente divisi nei vari gruppi la correlazione diventa positiva. In entrambi questi casi l’errore nasce da una variabile confondente, cioè la divisione in gruppi, che dev’essere considerata attentamente.
Il paradosso risulta evidente anche al contrario: avendo cinque gruppi di dati con correlazione posititiva, come nell’ultima immagine, si potrebbe pensare che mettendoli insieme la correlazione rimanga positiva, ma in realtà ciò non è vero.
Un esempio di vita reale in cui si verifica il paradosso è ad esempio negli studi clinici. Consideriamo $700$ pazienti che hanno i calcoli ai reni e due possibili trattamenti clinici, che chiamiamo trattamento $A$ e trattamento $B$. Metà dei pazienti riceverà il trattamento $A$, mentre l’altra metà riceverà il trattamento $B$. Dividiamo inoltre i pazienti tra chi ha i calcoli grandi e chi ha i calcoli piccoli. I due trattamenti hanno diverse percentuali di successo:
Trattamento A | Trattamento B | |
Calcoli piccoli | 81/87, 93% | 234/270, 87% |
Calcoli grandi | 192/263, 73% | 55/80, 69% |
Totale | 273/350, 78% | 289/350, 83% |
Notiamo che nonostante il trattamento $A$ sia più efficace in entrambi i gruppi di pazienti, considerando i due gruppi insieme il trattamento $B$ sembra più efficace. Questo risultato è palesemente errato, e in realtà è il trattamento $A$ ad essere più efficace. Il motivo per cui $B$ sembra più efficace in totale è che tra i pazienti che hanno ricevuto $B$, la maggior parte aveva calcoli piccoli che sono più facili da curare e in cui entrambi i trattamenti sono molto efficaci. Al contrario nel gruppo che ha ricevuto il trattamento $A$ la maggior parte aveva calcoli grandi difficili da curare.
In generale nell’architettare uno studio bisogna tener conto di tutti i possibili fattori confondenti, altrimenti è facile ottenere risultati errati. In questo caso il fattore confondente è la dimensione dei calcoli, che dev’essere considerata per ottenere risultati sensati. Se avessimo tenuto conto di questo fatto, avremmo distribuito i pazienti in maniera che eguali proporzioni di pazienti con calcoli grandi e piccoli avrebbe ricevuto i due trattamenti.
Questo principio si manifesta in moltissime altre occasioni. Ad esempio durante la pandemia di COVID-19 nella prima metà del 2021 la maggior parte delle persone vaccinate era anziana. Poiché gli anziani hanno un tasso di mortalità da COVID molto più elevato dei giovani, a quel punto separando semplicemente i morti tra vaccinati e non vaccinati, la maggior parte dei morti è tra i vaccinati. Tuttavia questo confronto è errato perché, come sopra, la maggior parte dei vaccinati è nel gruppo ad alta mortalità e al contrario la maggior parte dei non vaccinati è nel gruppo a bassa mortalità. In tal caso bisogna ulteriormente distinguere per età e confrontare, ad esempio, vaccinati anziani con non vaccinati anziani.
Un ultimo esempio in cui lo stesso principio si manifesta è nel divario salariale di genere. È noto che in media una donna guadagna meno di un uomo. Tuttavia non è immediatamente chiaro quale sia la motivazione, dato che potrebbero essere presenti dei fattori confondenti. Ad esempio tipicamente le donne lavorano in professioni meno remunerative degli uomini e questo spiega una parte del divario salariale ma non tutto. L’esistenza del divario salariale è precisamente l’affermazione che nonostante tutti i fattori confondenti siano stati tenuti in considerazione, una donna in media guadagna meno di un uomo, e quindi si può dire che a parità di lavoro effettuato una donna viene retribuita di meno di un uomo.