Facciamo pura theory fiction, per un attimo, e immaginiamo di aver raggiunto in un futuro prossimo uno sviluppo algoritmico tale che le macchine decidano al posto degli uomini. Lo scenario non è implausibile o per forza apocalittico, almeno stando a studi accreditati (e confermati ancora oggi) sulle prestazioni raggiungibili da un algoritmo: nel suo libro del 1954 Clinical vs. Statistical Prediction: A Theoretical Analysis and a Review of the Evidence, lo psicologo Paul Meehl ha sostenuto che le procedure algoritmiche di combinazione dei dati, quantomeno nell’ambito della previsione di un fenomeno o di una malattia, sono più performanti rispetto ai metodi clinici tradizionali. L’analisi favoriva quindi l’utilizzo di tali procedure meccaniche ed ha causato molto clamore tra i clinici, soprattutto. Non ditelo a Petrov, per carità: se si fosse fidato del sistema di rilevazione di attacchi nucleari, probabilmente non saremmo neanche qui a parlare. Quanto sostenuto da Meehl fece clamore ed è vero, ovviamente, ma si applica agli ambiti di previsione e decisione e non a tutti, soprattutto se si considera il lungo periodo: un algoritmo performa meglio in media di qualsiasi esperto umano perchè, di fatto, non è soggetto ai bias cognitivi che affliggono l’umano.
Algoritmi poliziotti
La statistica classica, del resto, con il teorema di Bayes, ci aiuta a comporre un altro pezzo della realtà in cui ci troveremmo. Poniamo di fare uso di un secondo algoritmo per prevedere se le persone che incontriamo per strada commetteranno un omicidio oppure no. Le probabilità a priori ci suggeriscono che, dati alla mano, il 96% su scala mondiale degli assassini sono uomini.
Perché l’algoritmo possa essere considerato corretto con un margine di affidabilità altrettanto tale, dovrà identificare soggetti che saranno in gran parte di sesso maschile, ovviamente considerando il dato che abbiamo a disposizione. Su un campione di 100 soggetti che vengono identificati come potenziali assassini dal nostro algoritmo ipotetico ci saranno 4 donne e 96 uomini, pertanto: se ipotizziamo che l’algoritmo abbia una precisione del 75% (riprendo l’esempio del libro Hello World di H. Fry), non è difficile convincersi che il numero di falsi positivi coinvolgerà necessariamente il campione più numeroso.
È un po’ come se in altri termini, per spiegarlo in maniera più informale ma probabilmente più efficace, il campione originale più popoloso si propagasse attraverso i “partizionamenti” successivi che abbiamo fatto. Non c’è motivo in effetti per pensare che quella percentuale finisca per essere contraddetta, ma è anche il motivo per cui è molto più facile che si sbagli a considerarsi assassino un uomo che non una donna.
Degenerazioni
Se mettessimo nel calderone social questo (semplice) ragionamento uscirebbero fuori una serie di considerazioni fuori dalle righe della serie uomini contro donne, in cui alcuni rimarrebbero l’aspetto legato al gran numero di assassini uomini (che rimane un dato oggettivo), qualcuno direbbe che i dati sono stati manipolati, che c’è una volontà politica di voler dire una cosa piuttosto che un’altra e, tristemente, nessuno parlerebbe di Bayes nè di Petrov. Che i social non li hanno probabilmente mai conosciuti, e forse non è stato proprio un male.
L’articolo è ispirato ad un capitolo del libro Hello world di Hannah Fry.