Mentire con le statistiche
Queste osservazioni completano
alcuni accenni
contenuti nelledizione italiana
di How to Lie
with Statistics di Darrell Huff
Trilussa e il pollo
(linganno
delle medie)
Giancarlo Livraghi agosto 2007
Disponibile anche in
pdf
(migliore come testo stampabile)
La più proverbiale osservazione a proposito delle medie statistiche è quella per cui se qualcuno mangia un pollo, e qualcun altro no, in media hanno mangiato mezzo pollo. (Ce ne sono altre di uguale significato, come il caso di una persona annegata in un fiume con un profondità media di mezzo metro).
Losservazione non è così ovvia e banale come può sembrare. Ma cominciamo col fatto che la storia del pollo statistico è attribuita a Trilussa. Infatti cè una sua poesia sullargomento, anche se definisce il problema in modo un po diverso.
La Statistica
Sai chedè la statistica? È na cosa
che serve pe fa un conto in generale
de la gente che nasce, che sta male,
che more, che va in carcere e che sposa.
Ma pe me la statistica curiosa
è dove centra la percentuale,
pe via che, lì, la media è sempre eguale
puro co la persona bisognosa.
Me spiego: da li conti che se fanno
secondo le statistiche dadesso
risurta che te tocca un pollo allanno:
e, se nun entra ne le spese tue,
tentra ne la statistica lo stesso
perché cè un antro che ne magna due.
Ai tempi di Trilussa mangiare pollo era considerata una cosa da ricchi.
Oggi la situazione è diversa. Ma non cambia il significato del ragionamento.
La fonte originale è meglio della vulgata. Non solo per lo stile e per lumorismo, ma anche perché imposta il concetto in modo più chiaro.
Oggi, con una più evoluta cultura della statistica, nessuno cade più in quel genere di errore? La cosa non è così semplice. Nel secondo capitolo, e anche in altre parti del suo libro, Darrell Huff spiega come vari generi di medie possono essere interpretati in modi diversi, spesso portando a risultati intenzionalmente ingannevoli o sbadatamente deformanti.
(In italiano la cosa è complicata anche dal fatto che la parola media è ambigua generalmente intesa come media aritmetica anche quando il dato più significativo è un indice diverso, come una mediana o una moda).
Ci si dimentica, un po troppo spesso, che la media è un dato poco significativo se non sappiamo a che cosa si riferisce, su quale base è calcolata, con quale criterio è definita.
Come dice, beffardo, Des McHale, «lumano medio ha una mammella e un testicolo». Più seriamente Aldous Huxley ci ha insegnato che «nella vita reale non cè alcun uomo medio». La media, comunque calcolata, è un concetto astratto. Una delle poche certezze assolute della statistica è che ciò che è medio non esiste. Ogni cosa si colloca necessariamente sopra o sotto il dato medio. E questa non è solo una questione di aritmetica.
Cè anche il fatto che il modo in cui singole cose (persone, fatti, situazioni, comportamenti) si discostano dalla media non è omogeneo, né lineare. (Vedi La campana di Gauss).
Sarebbe lungo riassumere qui ciò che è ampiamente spiegato nel libro, con molti e chiari esempi. Ma limportante è diffidare di ogni concetto standardizzato, anche quando non è espresso in forma di media numerica. (Per esempio accade spesso di leggere o sentir dire che tutti fanno o pensano qualcosa. Con un po di approfondimento non è difficile scoprire che quei tutti in realtà sono pochi o che una certa media, chissà come calcolata, non riflette alcuna persona o situazione reale).
Se è facile capire che tutti mangiano mezzo uovo al giorno è unaffermazione priva di senso, perché cè chi ne mangia di più e chi di meno, altre generalizzazioni altrettanto false sono più insidiose. È sempre bene ricordare che la media è solo un indice numerico, il cui significato può variare molto secondo i fattori di dispersione dei dati e secondo i criteri di analisi adottati in ciascun caso (ci sono efficaci esempi nei capitoli 2 e 3 del testo di Darrell Huff).
Del resto se fossimo tutti uguali e tutti facessimo le stesse cose il mondo sarebbe terribilmente noioso. Come sono noiosi (oltre che pericolosi) i discorsi, i proclami e i ragionamenti di chi ha la pretesa di standardizzarci magari sperando di poterci ridurre a numeri neutri e ripetitivi che soddisfino qualche suo arbitrario schema mentale.
A proposito di polli, cè
anche una pessima gestione
delle statistiche e dei dati numerici nella
tragicomica epidemia
di infondate paure per una infezione
aviaria nel 2005
come è spiegato
a pagina 195 di Mentire con le statistiche.