Scienza

5 cose che vengono spesso fraintese nella statistica

Da sempre l’uomo è ossessionato da cose simpatiche, belle ed impossibili (come nella canzone della Nannini, precisamente) tipo poter prevedere il futuro, ossessione seconda a quella di poter viaggiare nel tempo come il buon Martin Seamus McFly . In questo mondo così complicato, incomprensibile e spesso tutt’altro che a misura d’uomo, ognuno non può che augurarsi di avere il maggior numero possibile di persone nel proprio, personale teatrino: e di sicuro degli strumenti di misura possono aiutarci a comprendere meglio il mondo, se non a migliorarlo quantomeno a vederlo da una prospettiva differente dal solito.

La statistica è una delle materie, a mio parere, più fraintese e fraintendibili che possano esistere: questo perchè non fa parte del bagaglio culturale dell’italiano medio, che la conosce quasi esclusivamente per motivi calcistici (e spesso, anche lì, tende a darne un’interpretazione del tutto personale e quasi sempre fuori bersaglio, per non dire peggio).

Vediamo quindi le 5 cose che dovrebbero insegnarci a valutare la statistica nel modo migliore, quale prezioso strumento di supporto per le valutazioni e non come un libro sacro o una disciplina da piegare al nostro personale credo.

  1. Il caso non ha memoria: questa è la lezione zero di qualsiasi corso di statistica, in effetti, e la sua portata è straordinaria. Dire che il caso non ha memoria significa dare una giusta considerazione al concetto di probabilità: se, come nel gioco del lotto, peschiamo un numero dai 90 disponibili ad ogni ruota, ogni numero è equiprobabile rispetto a tutti gli altri, quindi non ha senso parlare di “numeri ritardatari” nelle estrazioni successive. Come ulteriore esempio, prendiamo una partita di calcio: in molti casi sentiamo il telecronista snocciolare numeri sui precedenti dello stesso incontro, ad esempio X vittorie per i gialli e Y per i verdi. Questo induce alcuni a dare per scontato l’esito della gara sulla base della maggiore probabilità: ma nel frattempo il mondo è cambiato, le squadre, gli allenatori, gli atteggiamenti pure. Gli eventi sono indipendenti tra loro, per dirla dandosi un po’ di arie. Anche valutare che una percentuale di vittorie dei gialli sia schiacciante rispetto a quella dei verdi, in pratica, non significa che sia scontato che succeda di nuovo nel prossimo futuro – ed è per questo che il fattore sorpresa viene valutato enormemente dagli scommettori.
  2. Questo ci porta ad un secondo punto importante, legato al fatto che la correlazione non implica causalità; sembra difficile da capire a prima vista, ma è in realtà abbastasnza semplice, come concetto. Significa che non possiamo trarre lezioni certe dall’analisi delle serie storiche di dati, specialmente se le confrontiamo e riguardano cose diverse tra loro. Il fisico Tyler Vigen, ad esempio, nel suo sito ha collezionato numerose correlazioni assurde o ridicole (e spesso prossime al 100%), ad esempio quella tra il numero di persone annegate cadendo in piscina ed il numero di film con Nicholas Cage, oppure tra la spesa annuale degli USA in scienza e tecnologia spaziale ed il numero di suicidi per strangolamento o soffocamento. Se due fenomeni sono correlati, pertanto, non vuol dire che uno sia la causa dell’altro – e se a qualcuno venissero in mente i pastafariani, potremmo davvero essere molto amici.
  3. Secondo la saggia interpretazione di Wikipedia, la statistica riguarda la “raccolta, l’organizzazione, l’analisi, l’interpretazione e la presentazione” di un insieme di dati diversi. Sono tutte parole chiave importanti: devi saper raccogliere i dati (e non, come fanno alcuni, valutare solo quelli che ti fanno comodo), devi saperli organizzare (ad esempio grazie al tuo PC), devi saper interpretare i risultati (devi studiare) e devi, come se non bastasse, essere in grado di trarre le giuste conclusioni (devi studiare al quadrato). Molte previsioni di fenomeni sono necessarie e ormai comuni al contesto, come nel caso dei pronostici online, ma bisogna essere bravi a rimanere critici sull’argomento e a percepirlo nel modo corretto.
  4. Ah sì: i sondaggi. Il fulcro principale su cui si basa la politica orwelliana di qualsiasi politico che (non) si rispetti! Come non parlarne? “Il popolo italiano è con me!11!!1 I sondagggi mi d’anno raggione!11” scrive, in maniera poco ortodossa (per non dire sgrammaticata) il politicante di turno, farneticando di avere la maggioranza o la totalità del popolo dalla propria parte. Eppure l’importanza del campione preso in considerazione deve essere sempre messa in conto, quando si valuta un sondaggio: se ne faccio uno tra i miei vicini di quartiere, ad esempio, finiranno per darmi apparentemente più ragione del farne uno con un campione di italiani davvero casuale.
  5. Ultimo punto da prendere in considerazione: il doppio cieco, un altro concetto solo apparentemente difficile su cui molto è stato detto, analizzato e studiato. Leggiamo spesso di esperimenti che sembrano confermare, su campioni di persone ad esempio, che un qualcosa sia davvero come uno stereotipo o una credenza comune tenda a suggerirci. Quando facciamo un esperimento, in altri termini, bisogna fare attenzione a non farci condizionare da aspetti emotivi inconsci, ed in particolare da quelli di aspettativa. Di fatto, quando ad esempio si testa un farmaco su un campione di pazienti, nè loro nè i medici dovrebbero sapere la natura di quello somministrato (ad esempio se omeopatico o di medicina tradizionale), in modo da non dare valutazioni soggettive poco utili o fuorvianti.

Che ne pensate? Sono da sempre affascinato dalla statistica e dal suo modo, se vogliamo, di spiegare quanto di piegare maliziosamente (purtroppo) la realtà ai propri comodi o alle proprie convinzioni regresse, e mi sembra interessante parlarne qui.

Salvatore Capolupo

Ingegnere informatico, blogger e consulente: per gli amici, più semplicemente, "bravo col computer".
Pulsante per tornare all'inizio