Big Data e verità… una lettura filosofica

In un articolo precedente abbiamo mostrato come e perché il Machine Learning sia nato e si sia poi allontanato progressivamente dall’impostazione teorica dell’Intelligenza Artificiale. Resta da analizzare, sempre con uno sguardo filosofico, quello che chiamiamo Big Data e che oggi aspira addirittura allo status di fonte di verità scientifiche.

La prima domanda da porsi è: si dice «il» Big Data o «i» Big Data? La parola latina «Data» è naturalmente il plurale di «datum»; eppure l’aggettivo «Big» obbliga a concepire Data come un singolare, nel senso che per «grande» (Big) si intende non il singolo datum ma la quantità di singoli dati che si manipolano.

«Big Data» è dunque un nome singolare che raggruppa una molteplicità, la molteplicità dei singoli «datum» digitalmente raccolti. Grammaticalmente parlando è una astrazione. Se dico «l’uomo è un animale che pensa», dico un nome singolare che definisce tutti gli esseri umani con le loro infinite diversità. Dico dunque una astrazione, perché astraggo dalle caratteristiche dei singoli esseri umani, che vengono cancellate appunto in un processo di astrazione. Il risultato, nel migliore dei casi, è il minimo comun denominatore che accomuna tutti gli elementi in un insieme.

Si vede allora quanto sia fallace l’idea del Big Data come di uno strumento conoscitivo che ci porta più vicino alla realtà delle cose. Il Big Data è a tutti gli effetti l’astrazione di altre astrazioni, poiché i datum (digitali) raccolti sono già essi misurazioni parziali di una realtà inevitabilmente più complessa. Questo tipo di obiezioni risale almeno a Galileo e al Libro della Natura «scritto nella lingua della matematica»: l’approccio scientifico matematizzante (oggi diremmo la computazione universale) comporta inevitabilmente la riduzione dell’oggetto osservato.

La situazione peggiora se consideriamo adesso l’aggettivo «Big» (grande), che rimanda alla quantità di dati e alla potenza di calcolo digitale per la loro manipolazione. Il problema non sta tanto nel timore che questa potenza divenga impossibile da gestire per l’uomo; a questo livello l’obiezione è semplicemente sociologica, politica, e riguarda l’organizzazione sociale: tutti aspetti interessanti ma che non riguardano il problema della Verità. Il problema è che il Big Data – l’accumulo di miliardi di dati e la ricerca di correlazioni che li uniscono – ha la pretesa di essere un nuovo metodo di ricerca scientifica, basato semplicemente sulle correlazioni che la macchina identifica. Ma è facile capire che questa scientificità poggia su basi molto labili.

In primis c’è il problema della massaia di Hegel – nella «Fenomenologia dello Spirito» – che è convinta che piova ogni volta che mette fuori il bucato. L’approccio del Big Data vorrebbe convincere la nostra massaia che piove perché mette fuori il bucato. Un set di dati a supporto di questa tesi esiste certamente, e solo la prova sperimentale potrebbe refutarne la conclusione. Ovviamente nel caso della massaia la sperimentazione è facile da organizzare, ma il Big Data si candida appunto a trovare verità scientifiche laddove la sperimentazione non è materialmente possibile.

Più grave ancora – e qui torniamo ad Heisenberg – una validità scientifica basata solamente sulla ripetizione assoluta non tiene conto dell’osservatore, che non è terzo ed esterno ma influenza i dati appunto osservando. Perché è chiaro che qualunque operazione prescrittiva dettata da un sistema di Machine Learning avrà come effetto di falsare proprio i dati e la correlazione che ha originato quella operazione prescrittiva. E lo stesso dicasi di ogni tentativo correttivo che dovrebbe eliminare gli effetti di questa influenza.

Informatici e tecnologici reclamano giustamente di poter lavorare col massimo grado di libertà, visto che è impossibile prevedere che direzione prenderanno queste nuove tecnologie. In cambio si può chieder loro di accettare che la Verità è qualcosa di più profondo che calcoli e algoritmi; e agli scienziati convinti che la computazione universale sia un fatto si deve ricordare che è la loro stessa scienza ad aver sollevato in proposito i dubbi più consistenti.

Il Big Data, contrariamente a quello che molti dicono e ripetono, è materia di Machine Learning e non di Intelligenza Artificiale. Non dovremmo dunque iniziare a discutere di etica del Big Data e del Machine Learning? Tertium non datur….

Giovanni LANDI

Autore del libro «Intelligenza Artificiale come Filosofia»
Expert dell’Istituto Europia

Apostolato Digitale

Condividere Codici di Salvezza

Big Data e verità… una lettura filosofica

Lascia un commento Annulla risposta