Cerca nel blog

2014/10/17

Il sito delle statistiche impossibili

Sapevate che più si riduce il numero delle colonie di api, più aumenta il numero degli arresti per possesso di marijuana? No? Eppure il grafico parla chiaro:


E non è inquietante il fatto che il numero degli annegamenti dovuti a una caduta in una piscina è correlato al numero di film all'anno nei quali ha recitato Nicolas Cage? Anche qui, il grafico è eloquente:


I dati sono reali: li ha raccolti e rappresentati graficamente Tyler Vigen, presso Tylervigen.com. Ma questi grafici non hanno lo scopo di sminuire la statistica o di insinuare che si può mentire facilmente e in modo molto convincente usando un grafico e scegliendo i dati opportuni: servono a ricordare che una correlazione non vuol dire nulla se non c'è anche un meccanismo di causa ed effetto che leghi le serie di dati.

Per esempio, all'inizio del secolo scorso i tumori ai polmoni, che prima erano rarissimi, stavano aumentando enormemente e non si sapeva perché. Ma nel 1929 il medico tedesco Fritz Lickint pubblicò il primo studio che indicava una forte correlazione fra fumo e tumore ai polmoni e suggerì che era sensato condurre studi ulteriori per verificare che ci fosse davvero un legame di causa ed effetto e non si trattasse di una correlazione spuria.

Le statistiche grafiche, insomma, sono uno strumento potente per far emergere fenomeni che altrimenti resterebbero sepolti nei numeri, e l'informatica è un alleato molto efficiente in questo campo; ma ci vuole l'intelligenza umana, abbinata alla conoscenza del mondo reale, per decidere se la correlazione fra due variabili è semplice coincidenza o se c'è davvero un legame di causa.

Altrimenti dovremmo concludere che il consumo di formaggio causa la morte per intrappolamento fra le lenzuola, come si evince da questo grafico:



Nessun commento: