Big Data e verità… una lettura filosofica

In un articolo precedente abbiamo mostrato come e perché il Machine Learning sia nato e si sia poi allontanato progressivamente dall’impostazione teorica dell’Intelligenza Artificiale. Resta da analizzare, sempre con uno sguardo filosofico, quello che chiamiamo Big Data e che oggi aspira addirittura allo status di fonte di verità scientifiche.

La prima domanda da porsi è: si dice «il» Big Data o «i» Big Data? La parola latina «Data» è naturalmente il plurale di «datum»; eppure l’aggettivo «Big» obbliga a concepire Data come un singolare, nel senso che per «grande» (Big) si intende non il singolo datum ma la quantità di singoli dati che si manipolano.

«Big Data» è dunque un nome singolare che raggruppa una molteplicità, la molteplicità dei singoli «datum» digitalmente raccolti. Grammaticalmente parlando è una astrazione. Se dico «l’uomo è un animale che pensa», dico un nome singolare che definisce tutti gli esseri umani con le loro infinite diversità. Dico dunque una astrazione, perché astraggo dalle caratteristiche dei singoli esseri umani, che vengono cancellate appunto in un processo di astrazione. Il risultato, nel migliore dei casi, è il minimo comun denominatore che accomuna tutti gli elementi in un insieme.

Si vede allora quanto sia fallace l’idea del Big Data come di uno strumento conoscitivo che ci porta più vicino alla realtà delle cose. Il Big Data è a tutti gli effetti l’astrazione di altre astrazioni, poiché i datum (digitali) raccolti sono già essi misurazioni parziali di una realtà inevitabilmente più complessa. Questo tipo di obiezioni risale almeno a Galileo e al Libro della Natura «scritto nella lingua della matematica»: l’approccio scientifico matematizzante (oggi diremmo la computazione universale) comporta inevitabilmente la riduzione dell’oggetto osservato.

La situazione peggiora se consideriamo adesso l’aggettivo «Big» (grande), che rimanda alla quantità di dati e alla potenza di calcolo digitale per la loro manipolazione. Il problema non sta tanto nel timore che questa potenza divenga impossibile da gestire per l’uomo; a questo livello l’obiezione è semplicemente sociologica, politica, e riguarda l’organizzazione sociale: tutti aspetti interessanti ma che non riguardano il problema della Verità. Il problema è che il Big Data – l’accumulo di miliardi di dati e la ricerca di correlazioni che li uniscono – ha la pretesa di essere un nuovo metodo di ricerca scientifica, basato semplicemente sulle correlazioni che la macchina identifica. Ma è facile capire che questa scientificità poggia su basi molto labili.

In primis c’è il problema della massaia di Hegel – nella «Fenomenologia dello Spirito» – che è convinta che piova ogni volta che mette fuori il bucato. L’approccio del Big Data vorrebbe convincere la nostra massaia che piove perché mette fuori il bucato. Un set di dati a supporto di questa tesi esiste certamente, e solo la prova sperimentale potrebbe refutarne la conclusione. Ovviamente nel caso della massaia la sperimentazione è facile da organizzare, ma il Big Data si candida appunto a trovare verità scientifiche laddove la sperimentazione non è materialmente possibile.

Più grave ancora – e qui torniamo ad Heisenberg – una validità scientifica basata solamente sulla ripetizione assoluta non tiene conto dell’osservatore, che non è terzo ed esterno ma influenza i dati appunto osservando. Perché è chiaro che qualunque operazione prescrittiva dettata da un sistema di Machine Learning avrà come effetto di falsare proprio i dati e la correlazione che ha originato quella operazione prescrittiva. E lo stesso dicasi di ogni tentativo correttivo che dovrebbe eliminare gli effetti di questa influenza.

Informatici e tecnologici reclamano giustamente di poter lavorare col massimo grado di libertà, visto che è impossibile prevedere che direzione prenderanno queste nuove tecnologie. In cambio si può chieder loro di accettare che la Verità è qualcosa di più profondo che calcoli e algoritmi; e agli scienziati convinti che la computazione universale sia un fatto si deve ricordare che è la loro stessa scienza ad aver sollevato in proposito i dubbi più consistenti.

Il Big Data, contrariamente a quello che molti dicono e ripetono, è materia di Machine Learning e non di Intelligenza Artificiale. Non dovremmo dunque iniziare a discutere di etica del Big Data e del Machine Learning? Tertium non datur….

Giovanni LANDI

Autore del libro «Intelligenza Artificiale come Filosofia»
Expert dell’Istituto Europia

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *