Statistica per chi ha fretta
Tradotto da Felice Rocchitelli, originale di Cassie Kozyrkov
Hai mai desiderato che qualcuno ti spiegasse in maniera semplice e senza troppi tecnicisimi, in un italiano comprensibile, cos’è la statistica? Fammi provare ad esaudire il tuo desiderio! Andremo ad analizzare le più grandi idee statistiche in 8 minuti! O magari 1 minuto, se rimani incollato allo schermo.
Cos’è una statistica? È un qualsiasi metodo per scandagliare i dati a disposizione. Si. Definizione tecnicamente corretta al 100%. Ora cerchiamo di vedere su cosa si basa la disciplina statistica.
La statistica è la scienza di cambiare idea.
Prendere decisioni basandosi sui fatti (parametri) è già difficile di per sé, ma -cavolo!- a volte non abbiamo a disposizione neanche i fatti che ci servono. Invece, ciò che sappiamo (i nostri campioni) è differente da ciò che avremmo voluto sapere (la nostra popolazione campionaria). Questo è ciò che significa l’esistenza dell’incertezza.
La statistica è la scienza di cambiare idea in condizioni di incertezza. Su cosa dovrebbe essere basato il tuo modo di pensare? Un’azione di default o una convinzione precedente. E se la tua mente fosse una tabula rasa? Leggi questo articolo.
I bayesiani cambiano idea sulle convinzioni.
La statistica Bayesiana è la scuola di pensiero che si occupa di aggregare i dati per aggiornare le tue convinzioni. Ai bayesiani piace riportare i propri risultati usando intervalli credibili (due numeri interpretabili come, “penso che la risposta si trovi tra questo punto e quest’altro punto”).
I frequentisti cambiano idea sulle azioni.
La statistica frequentista (o frequentistica o a posteriori) si occupa di farti ripensare alle azioni. Non ti serve avere una convinzione per effettuare un’azione di default, è semplicemente ciò che sei impegnato a fare se non analizzi tutti i dati. La statistica frequentista (a.k.a. classica) è quella che con maggiori probabilità incontrerai in giro o nei tuoi corsi STAT101. Quindi continuiamo a chiamarla classica per il resto dell’articolo.
Le ipotesi sono la descrizione di ciò che il mondo potrebbe essere.
L’ipotesi nulla descrive tutte le condizioni in cui prendere la decisione di default risulta essere una scelta felice; le ipotesi alternative sono tutte le condizioni restanti. Se ti convincessi -con i dati!- del fatto che tu non viva in una condizione di ipotesi nulla, allora sarebbe meglio che tu cambiassi idea e prendessi un’azione alternativa.
Per esempio: “Possiamo andare in classe insieme (azione di default) se ci mettessi 15 minuti per essere pronto (ipotesi nulla), ma se le evidenze (i dati) suggerissero che impiegheresti di più (ipotesi alternativa), puoi andarci da solo perché io sarò già lì (azione alternativa).”
In estrema sintesi: “Le evidenze rendono l’ipotesi nulla ridicola?”
Tutta l’attività di testare le ipotesi si basa sulla domanda: le evidenze in nostro possesso fanno sembrare l’ipotesi nulla ridicola? Rigettare l’ipotesi nulla significa che abbiamo imparato qualcosa e dovremmo cambiare idea. Non rigettare l’ipotesi nulla significa che non abbiamo imparato nulla di interessante. È come se facessimo una passeggiata nella foresta e non trovassimo nessun umano, ciò non proverebbe il fatto che non ci siano umani sul pianeta. Significherebbe soltanto che non abbiamo scoperto nulla di interessante circa l’esistenza umana. Ti rende triste il non imparare nulla? Non dovrebbe, perchè possiedi un amorevole meccanismo di sicurezza: sai esattamente quale azione intraprendere. Se non hai imparato nulla non vi è ragione che tu cambi idea, quindi continua ad effettuare l’azione di default.
Quindi, come possiamo sapere se abbiamo, o meno, imparato qualcosa di interessante, qualcosa al di là delle condizioni con le quali continuiamo a effettuare l’azione di default? Per trovare una risposta, possiamo osservare il p-value o un intervallo di confidenza.
Il p-value sulla tavola periodica: è l’elemento sorpresa.
Il p-value afferma, “Se vivessi in condizioni in cui dovessi intraprendere l’azione di default, quanto sarebbero prevedibili le evidenze empiriche in mio possesso?” Tanto minore è il p-value, tanto più intensamente i dati in nostro possesso direbbero “Wow, questo è sorprendente, probabilmente dovresti cambiare idea!”
Per effettuare un test, prova a comparare il p-value con una indicatore conosciuto come livello di significatività. È una sorta di manopola che puoi usare per tarare il livello di rischio che sei disposto a tollerare. È la probabilità massima per la quale tu possa stupidamente accettare di abbandonare la tua comoda e confortevole azione di default. Se imposti il livello di significatività a 0, ciò significa che ti rifiuti di abbandonare la tua azione di default a meno che tu non sia sicuro di non sbagliare. Posate le penne! Non analizzate alcun dato, intraprendete pure l’azione di default. (Ciò significherebbe che potreste finire per continuare a intraprendere un’azione di default sbagliata.)
Un intervallo di confidenza è semplicemente un modo per riportare i risultati dei test sulle tue ipotesi. Per usarlo, controlla che coincida con la tua ipotesi nulla. Se coincide, non hai imparato nulla. Se non dovesse coincidere, ripensaci.
Cambia idea soltanto se l’intervallo di confidenza non coincide con la tua ipotesi nulla.
Mentre un intervallo di confidenza risulta, tecnicamente parlando, un po’ complesso (Parlerò di questo in un futuro post, è decisamente più complesso dell’intervallo credibile che abbiamo incontrato prima, e non vorrei semplificarlo troppo), esso possiede due proprietà utili che gli analisti trovano d’aiuto nel descrivere i propri dati: (1) l’ipotesi migliore è sempre al suo interno ed (2) è più esiguo in presenza di tanti dati. Sii prudente perché entrambi p-value e intervalli di confidenza non sono stati elaborati affinché potessero risultare di semplice spiegazione, non ti aspettare una definizione sintetica. Sono solo un modo per riassumere i risultati dei test. (Se dovessi seguire un corso e dovessi trovare le definizioni impossibili da ricordare, ecco il perché. A nome della statistica: non riguarda te, riguarda me stessa.)
Qual è il punto? Se esegui i test con i metodi appena descritti, la matematica garantisce che il rischio di commettere un errore è limitato ad un livello di significatività da te precedentemente scelto (che è il motivo principale per il quale è importante che tu ne scelga uno… la matematica è lì per assicurare i livelli di rischio da te imposti, ciò non avrebbe molto senso se tu non ti preoccupassi affatto del rischio).
La matematica basa tutto sulla costruzione di modelli capaci di descrivere l’universo delle ipotesi nulle. È così che si ottiene il p-value.
Cosa sono tutte queste formule pazze, queste probabilità e distribuzioni? Ci permettono di esporre le regole che governano l’universo delle ipotesi nulle affinché si possa comprendere se tale universo è quel tipo di posto in cui i dati rappresentano la realtà fenomenica. E se non lo è, gridi: “Ridicolo! Fuori di testa!”. Se lo è, scuoti le spalle per non aver imparato nulla. Lo approfondiremo in un futura pubblicazione. Per ora, pensa alla matematica come un metodo per creare mondi miniaturizzati all’interno dei quali l’insieme di dati in nostro possesso sembri sensato. Il p-value e l’intervallo di confidenza sono dei metodi per riassumere tutto ciò cosicché tu non debba dilungarti troppo in una prolissa descrizione dell’universo. Sono l’obiettivo finale: usali per vedere se abbandonare o meno la tua azione di default. Fatto!
Abbiamo svolto in nostri compiti? Ecco cosa misura la potenza.
Aspetta, abbiamo svolto in nostri compiti per assicurarci che abbiamo raccolto abbastanza evidenze per darci una chiara occasione di cambiare idea? Ecco cosa misura il concetto di potenza. È veramente semplice non trovare nessuna evidenza che possa spingerti a cambiare idea… non cercarla. Maggiore è la potenza ottenuta, e maggiori sono le opportunità che hai dato te stesso di cambiare idea qualora risulti la cosa giusta da fare. La potenza è la probabilità di abbandonare correttamente la tua azione di default.
Quando non impariamo nulla e continuiamo a fare ciò che stiamo facendo, possiamo sentirci meglio circa il processo utilizzato se abbiamo ottenuto valori elevati di potenza. Almeno abbiamo svolto i nostri compiti. Se avessimo a mala pena potenza, sapremmo abbastanza bene che non dovremmo cambiare idea. Potremmo pure non annoiarci nell’analizzare i dati.
Usa l’analisi di potenza per controllare che tu abbia considerato abbastanza dati prima di iniziare.
L’analisi di potenza è una metodologia per controllare il valore di potenza preventivato per un certo numero di dati. Lo utilizzi per pianificare i tuoi studi prima di iniziare. (È anche abbastanza semplice; in una futura pubblicazione ti mostrerò che tutto ciò che serve sono alcuni cicli for.)
Incertezza significa poter arrivare alle conclusioni errate, anche se hai utilizzato i migliori modelli matematici al mondo.
Cosa non è la statistica? Magia mistica che ricava l’incertezza dall’incertezza. Non c’è alcuna magia che possa farlo; puoi ancora commettere degli errori. A proposito di errori, questi sono due tipi di errore che puoi trovare nella statistica Frequentista. (I bayesiani non commettono errori. Scherzo! Dicamo, una specie. Rimani collegato per la pubblicazione sulla statistica Bayesiana.)
Errore di primo tipo è la rinuncia irragionevole dell’azione di default. Ehi, avevi detto che ti sentivi a tuo agio nell’intraprendere l’azione di default e ora grazie a tutta questa matematica hai abbandonato. Ouch! Errore di secondo tipo è la non rinuncia irragionevole dell’azione di default. (Noi statistici siamo così creativi nel dare i nomi alle cose. Indovina quale dei due errori è peggio. Primo tipo? Si. Troppo creativi.)
L’errore di primo tipo significa cambiare idea quando non dovresti.
L’errore di secondo tipo significa NON cambiare idea quando dovresti.
L’errore di primo tipo è come convincere una persona innocente e l’errore di secondo tipo è come fallire nel convincere una persona colpevole. Le probabilità dei due errori sono in equilibrio (rendere più semplice convincere una persona colpevole rende anche più semplice convincere una persona innocente), a meno che tu non riceva maggiori evidenza (dati!), in tal caso entrambi gli errori diventano meno probabili e tutto migliora. Ecco perché gli statistici vogliono avere sempre più dati! Tutto migliora quando hai più dati.
Più dati significa una maggiore protezione da conclusioni errate.
Cos’è la correzione per confronti multipli? Devi effettuare i tuoi test con metodi differenti se sai di dover rispondere a diverse domande sullo stesso insieme di dati. Se continui, incondizionalmente, a mettere tra gli imputati sospetti innocenti (se continui a pescare tra i tuoi dati) eventualmente qualcuno sembrerà colpevole per un errore casuale. Il termine statisticamente significativo non significa che qualcosa di importante è accaduto alla luce del giorno. Significa semplicemente che abbiamo cambiato idea. Magari sbagliando. Maledetta incertezza!
Non sprecare il tuo tempo a rispondere in maniera rigorosa a domande sbagliate. Applica la statistica intelligentemente (e solo se necessaria).
Che cos’è l’errore di terzo tipo? È come uno scherzo statistico: si basa sul rigettare correttamente l’ipotesi nulla sbagliata. In altre parole, usare tutta la matematica in maniera impeccabile per rispondere alla domanda sbagliata.
Una cura per chiedere e rispondere alle domande sbagliate può essere trovata nella Decision Intelligence Engineering, la nuova disciplina che mira ad applicare la scienza dei dati per risolvere problemi aziendali e rendere migliori le decisioni intraprese. Padroneggiando la decision intelligence, ti costruisci l’immunità agli errori di terzo tipo e dall’analitica inutile.
Riassumendo, la statistica è la scienza del cambiare idea. Ci sono due scuole di pensiero. La più popolare — Statistica Frequentista — si basa sul controllare qualora tu dovessi abbandonare la tua azione di default. La statistica Bayesiana si basa sul sostenere un’opinione a priori e aggiornarla con l’aiuto dei dati. Se la tua mente è davvero sgombera prima che tu inizi, guarda i tuoi dati e lasciati guidare dal tuo istinto.
Clicca qui, per saperne di più sulla scienza dei dati e l’intelligenza artificiale.