Nobel 2024, Fisica: propagazione degli errori e vertigini da etichetta


1. ETICHETTE

Goffrey Hinton è uno psicologo che ha vinto il Premio Nobel per la fisica in riconoscimento delle sue innovazioni nel campo dell’informatica. Questo mix di discipline mostra quanto svantaggiosa sia la rigidità nella separazione delle competenze e l’insistenza sulla specializzazione; ma sorprende che questa evidenza venga portata alla luce da un personaggio che ha costruito la sua carriera sulla ricerca di meccanismi destinati a compiere operazioni automatiche di smistamento e smistamento – anzi, per di più, a insegnare metodi di lettura di contenuti non strutturati per applicarli a catalogazione. etichette.

Hinton meriterebbe un premio Nobel per la caparbietà, per la tenacia con cui ha continuato a partecipare all’evoluzione delle reti neurali e apprendimento profondoanche nei periodi “invernali” dell’intelligenza artificiale, con la riduzione degli investimenti, la sfiducia da parte delle istituzioni, il dubbio dei finanziatori. Non solo: per almeno un paio di decenni i budget destinati alla ricerca nel settore dell’intelligenza artificiale hanno sostenuto soprattutto progetti che non credevano nella possibilità del machine learning, e che si affidavano a software in cui i processi di comprensione, decisione e l’azione erano definite dalle regole di comportamento stabilite a priori dallo sviluppatore umano.

Nel 2012 Hinton, con i suoi compagni Alex Krizhevsky e Ilya Sutskever, ha presentato al concorso ImageNet il riconoscimento delle immagini AlexNet: dobbiamo l’enorme successo di questa macchina alla convinzione diffusa che intelligenza artificiale, reti neurali e deep learning siano tutti sinonimi. Non solo il software ha vinto il concorso 2012, ma l’indice di precisione nella classificazione delle immagini è migliorato di oltre 10 punti percentuali rispetto all’edizione precedente: un passo avanti nelle prestazioni dell’intelligenza percettiva mai registrato prima nella storia del concorso. Era chiaro a tutti che la disciplina in quel momento aveva avviato una nuova fase, e che il modello di progettazione e di funzionamento era cambiato. La prova è che Sutskever è stato tra i fondatori di OpenAI nel 2015, e che è stato arruolato fino a novembre 2023 come ingegnere capo dello sviluppo di ChatGPT, il progetto in cui l’intelligenza artificiale ha oltrepassato i confini dell’interesse specialistico e si è imposta all’attenzione di massa. pubblico alla fine del 2022.

2. LIVELLI NASCOSTI E SUPPORTO ERRORI

I trent’anni di lavoro che precedono AlexNet ruotano attorno al concetto di propagazione all’indietro dell’errore nel processo di apprendimento delle reti neurali. Hinton non ha inventato l’idea o il metodo, ma la sua testardaggine nel coltivarli è servita non meno del suo contributo alle procedure attuali e alla loro diffusione nell’elaborazione del paradigma contemporaneo dell’IA.

AlexNet e le reti neurali che gli assomigliano (quelle convoluzionali) sono costruite con diversi livelli di unità di elaborazione. Nel primo strato i “neuroni” mappano l’immagine in una griglia di piccole cellule, in analogia a quanto avviene nella fisiologia della percezione umana.

Il risultato di questo schema di ricezione viene esaminato dagli strati “nascosti” delle unità di elaborazione, che interpretano i confini e i colori della figura. L’effetto è quello di rimappare l’immagine leggendo i livelli, che separano il soggetto dallo sfondo, esaminano le parti, valutano le pose, ecc.; possono anche astrarre verso concetti come “lealtà” o “familiarità”. Maggiore è il numero di questi livelli intermedi, maggiore è il livello di affidabilità con cui l’immagine viene fatta corrispondere all’etichetta che la descrive. A sua volta, la didascalia deriva da una tassonomia che la macchina ha memorizzato durante la prima fase di addestramento, insieme a una galleria di migliaia, se non milioni, di immagini già classificate.

Il compito del software è quindi quello di associare pattern di pixel colorati alle etichette degli schedari, con una certa probabilità. Nella fase di addestramento supervisionato, se la didascalia selezionata dalla macchina è corretta, il sistema rimane invariato; se, invece, l’output è errato, il giudizio di errore si propaga tra gli strati intermedi che hanno contribuito alla stima, provocando una variazione del “peso” del calcolo. Il processo interessa tutte le unità di lavorazione, e il suo miglioramento è ancora il principale argomento di ricerca degli esperti del settore, come ha testimoniato Yann LeCun in un post su X poco meno di un anno fa.

La mancanza di fiducia in personaggi come Marvin Minsky e Seymour Papert sulla fattibilità stessa degli errori arretrati ha dirottato per anni finanziamenti verso progetti che escludevano apprendimento profondo: al momento della prima rete neurale, il Percettrone da Frank Rosenblatt che nel 1958 era solo 1° livello intermedio, le difficoltà sembravano insormontabili. Come nella storia dei grandi profeti, Hinton si è armato di fede, di speranza – e anche senza la carità dei grandi finanziatori istituzionali, ha messo in moto una macchina che poteva imparare a dare risultati.

3. LIMITI

La descrizione, troppo colpevole e troppo riduttiva, del funzionamento di AlexNet suggerisce anche le condizioni e i limiti del concetto di intelligenza che sta alla base della tecnologia delle reti neurali. Già nello schema di Rosenblatt il riconoscimento delle immagini è inteso come un metodo che porta alla comprensione del contenuto auto-organizzando il contributo di tanti attori atomici, facendo corrispondere le unità di calcolo: un altro articolo su «Controversie» ha esplorato come ciò. un modello cognitivo derivato dal liberalismo economico e sociale di Von Hayek. Ma è ora importante evidenziare altri due aspetti del modello: l’isolamento dell’apprendimento da qualsiasi considerazione pragmatica e la considerazione costruttiva dal basso verso l’alto nel processo di interpretazione.

Merleau Ponty ha esplorato in modo fenomenologico il ruolo che l’attenzione gioca nella percezione: riconoscere persone e cose non è una serie di shock visivi che esplodono dal nulla, ma un flusso che segue un percorso da una maggiore incertezza a un maggiore dettaglio, sulla questione dell’esempio . L’applicazione sfida la nostra libertà di avvicinarci, di esplorare, di interagire: il riconoscimento avviene sullo sfondo di un mondo già in qualche modo precompreso, e che solleva interrogativi a partire dal rapporto che abbiamo con la scena in cui ci troviamo. sono immersi – per cui lo stesso masso si rivolge in modo diverso a un geologo, o a un turista stanco di passeggiare con il suo cane.

D’altra parte, il riconoscitore artificiale di immagini non stabilisce alcuna relazione con il mondo e non ha domande da porre. Egli, infatti, non ha alcuna conoscenza dell’esistenza del mondo e della possibilità di stabilire un qualsiasi rapporto con esso. La macchina valuta la probabilità che l’attivazione di determinati pattern di unità ricettive possa essere associata ad una delle etichette presenti nel file di memoria. Ciò spiega come si possa cadere nella trappola degli attacchi avversari, dove il “rumore informativo” dovuto alla sostituzione di alcuni pixel (che non modificano affatto l’aspetto dell’immagine ai nostri occhi) fa cambiare, in modo convincente, le stime di AlexNet . preferisce l’etichetta struzzo a quelli loro correttamente assegnati in precedenza tempio e canna.

Senza un mondo che funga da orizzonte di senso per azioni e interpretazioni, non ci sono domande, quindi nemmeno riconoscimento e intelligenza – nel senso attuale di questi termini. Non esiste nemmeno la possibilità di autocorrezione, come quella che istintivamente sviluppiamo quando incontriamo un problema. ingannare l’occhio o in qualche illusione ottica: la stabilità del mondo, e non la coerenza delle leggi della paura, che ci permette di riconoscere l’errore. L’inganno per noi è in realtà momentaneo, poi la coerenza dell’esperienza della realtà torna a ripristinare il senso della percezione (anche nei casi di abuso di sostanze psicotrope): ecco perché siamo consapevoli di essere vittime delle illusioni.

La separazione della sfera cognitiva da quella pragmatica e la riduzione della mente a un sistema di procedure risolvere problemipiuttosto intrappolare la percezione in un mondo di specchi e concetti senza via d’uscita. Le conclusioni che si diffondono dalle unità di percezione nucleare sono la correlazione di un universo di etichette che non rimandano a nulla di reale – tanto che si può riconoscere uno struzzo invece di un tempio, senza alcun tipo di disagio. È quell’inquietudine che colpisce l’individuo intelligente di fronte all’abisso della stupidità.

BIBLIOGRAFIA

Bottazzini, Paolo, Nello specchio dell’intelligenza artificiale – L’occhio del maestro«Controversie», 4 giugno 2024.

LeCun, Yann, Ignora il diluvio di assurdità su Q*,

Merleau-Ponty, Maurizio, Fenomenologia della percezioneGallimard, Parigi 1945; trans. è. a cura di Andrea Bonomi, Fenomenologia della percezioneBombiani, Milano 2003.

Minsky, Marvin; Papert, Seymour, PercettroniMIT Press, Cambridge 1969.

Rumelhart, David E.; Hinton, Geoffrey E.; Williams, Ronald J., Rappresentazioni dell’apprendimento mediante propagazione all’indietro degli errori«Natura», vol. 323, n. 6088, 9 ottobre 1986, pp. 533–536.

Szegedy, Christian, Zaremba, Wojciech, Sutskever, Ilya, Bruna, Joan, Erhan, Dumitru, Goodfellow, Ian, Fergus, Rob (2013), Proprietà sorprendenti delle reti neurali‘arXiv’, prestampa arXiv:1312.6199.

  • Paolo Bottazzini

    laureato in filosofia, si occupa di media digitali dal 1999: è cofondatore di Pquod e SocialGraph, società specializzate in comunicazione web e analisi dati. Contemporaneamente ha svolto attività didattica sui temi della comunicazione digitale per il Politecnico di Milano, per il Corep del Politecnico di Torino, per il Dipartimento di Filosofia dell’Università degli Studi di Milano. Descrive i modelli cognitivi emergenti dei nuovi media nella monografia pubblicata nel 2010: Googlecracy. Dal febbraio 2011 hanno visto la loro evoluzione negli articoli pubblicati sui quotidiani Linkiesta, pagina99, Gli Stati Generali.

    Visualizza tutti gli articoli



Techno Quantico

Leave a Reply

Your email address will not be published. Required fields are marked *