domenica 24 giugno 2007

La prospettiva delle reti neurali

Dal senso al significato Coord. Giuseppina Miccoli, del_senso.doc

Negli ultimi anni comunque la scienza cognitiva e lo studio sull’intelligenza artificiale si stanno muovendo verso un approccio che tenta di superare i dubbi a livello epistemologico, filosofico, biologico ed empirico insito nell’analogia organismo-computer. Secondo Clark (Clark, 1994) i modelli di intelligenza artificiale che hanno dominato, per tutti gli anni settanta ed ottanta, hanno esaminato la natura del pensiero umano dall’interno dell’esperienza umana normale ed hanno riposto troppa fiducia nella visione che la mente stessa ha della mente.
Secondo questa prospettiva, che Clark definisce “dell’occhio della mente”, “...le entità che hanno trovato il modo di giocare un ruolo in questi modelli sarebbero una traduzione abbastanza diretta in appropriati codici macchina delle nostre comuni espressioni di credenze e desideri” (Clark, 1994). Secondo Clark questi approcci sono uno sviluppo evoluzionistico recente, finalizzato senza dubbio a facilitare le nostre interazioni sociali quotidiane: “I programmi sono stati in grado di imparare a fondere e confrontare vecchie, ma valide, strategie per andare incontro a nuove richieste; nuove strutture di dati hanno permesso ad un calcolatore di rispondere a domande relative alle implicazioni, non enunciate, di storie; i programmi di criptaritmetica riescono facilmente a superare le mie e le vostre capacità. Nonostante ciò sembra mancare qualcosa. Ai calcolatori programmati manca il sapore dell’intelligenza reale. Essi sono rigidi e fragili, capaci solo di eseguire bene solo alcuni compiti” (Clark, 1994).
Clark propone allora l’alternativa PDP (processi distribuiti paralleli) che lui definisce anche “dell’occhio del cervello”. Questa etichetta si riferisce alla similarità tra architetture dei modelli connessionisti e struttura cerebrale. Queste architetture si ispirano alle strutture neurali. I circuiti neurali delle lumache, dei criceti, delle scimmie e dell’uomo sono grandi reti parallele di processori riccamente interconnessi, ma relativamente lenti e semplici. La relativa lentezza dei singoli processori è controbilanciata dal fatto che essi collaborano in parallelo all’esecuzione dello stesso compito. Quello che avviene in queste reti è illustrato con una classica analogia con quello che accade quando una pellicola di sapone si distende attraverso un cerchio (come nelle bolle di sapone). Ogni molecola di sapone viene influenzata solo da quelle immediatamente vicine. Sul bordo la loro posizione è influenzata dal cerchio (il sistema iniziale). L’effetto iniziale viene propagato attraverso una serie diffusa di interazioni locali fino a quando non viene raggiunto un ordine globale. La pellicola di sapone si dispone in una configurazione stabile attraverso il cerchio. In un sistema PDP a questo punto diciamo che la rete si è rilassata in una soluzione del problema globale. Nella computazione, questo tipo di cooperazione in parallelo si rivela molto utile quando il compito richiede la soddisfazione simultanea di un gran numero di vincoli piccoli o “deboli”. In questi casi l’uso di un’architettura di cooperazione in parallelo può rendere trattabili compiti che (con processori così lenti) non saremmo mai in grado di portare a termine nel tempo a disposizione.
“Questi modelli sono ovviamente utili per compiti elementari, da un punto di vista evoluzionistico, come la visione e il controllo sensomotorio. (...) E’ infatti possibile che la flessibilità e il senso comune, che associamo al raggiungimento dei più alti traguardi della cognizione umana, siano il risultato di una forma computazionale sottostante scelta dalla selezione naturale proprio per la sua capacità di risolvere problemi prioritari da un punto di vista evoluzionistico” (Clark, 1994). La potenza di un sistema connessionista risiede non nelle singole unità (che sono processori abbastanza semplici), ma nelle connessioni abilmente costruite tra loro. Si sa infatti da lungo tempo che il cervello è composto da molte unità (neuroni), unite in parallelo da una vasta e intricata massa di giunzioni (sinapsi). In qualche modo questo insieme di unità relativamente semplici e di interconnessioni complesse dà origine alle più potenti macchine calcolatrici finora conosciute: gli organismi biologici. Gli studi nel campo dei processi distribuiti paralleli PDP sono ispirati dalle strutture neurali nel senso che anche i sistemi PDP usano processori molto semplici uniti in parallelo in modo intricato.
Queste teorizzazioni ispirate alle conoscenze neurali hanno un recente passato. In un certo senso discendono dalla psicologia della Gestalt . Senza andare troppo lontano possiamo dire che esse si muovono sul cammino tracciato dalla cibernetica, lo studio dei sistemi di autoregolazione. All’interno della cibernetica gli antecedenti più ovvi del connessionismo sono i lavori di Mc Culloch, Pitt, Hebb e Rosenblatt (Clark, 1994). Mc Culloch e Pitt dimostrarono che una rete idealizzata di elementi neuronali con connessioni eccitatorie e inibitorie poteva computare le funzioni logiche e, o e non (secondo la logica questo è sufficiente per esprimere qualsiasi funzione logica). Hebb fece un passo ulteriore suggerendo che semplici reti connessioniste possono memorizzare la corrispondenza di configurazioni di ingresso e uscita e possono imparare da sole, per esperienza, a distribuire i pesi delle connessioni tra le unità in modo da dare la risposta desiderata.
Rosenblatt aggiunse oltre con il suo lavoro sul percettrone. Il percettrone è una piccola rete di unità di ingresso connesse attraverso alcune unità intermedie con una unità di uscita. Questo modello verrà poi ulteriormente perfezionato da Mc Lelland, Rumelhart e Gruppo di ricerca PDP (Clark, 1994) proponendo un modello che possiede regole di apprendimento che, nella maggioranza dei casi, permettono ad un sistema dotato di unità nascoste di imparare ad usarle in qualsiasi modo sia necessario per il riconoscimento della struttura di input-output richiesta. I modelli PDP più recenti usano mezzi di codifica e di elaborazione dell’informazione che sono particolarmente adatti per compiti evoluzionisticamente primitivi come la visione e il controllo sensomotorio. Le architetture PDP cioè reti di unità connesse da legami inibitori ed eccitatori, organizzate in modo da seguire regole di apprendimento, sarebbero una scelta evoluzionisticamente naturale per eseguire tali compiti in modo relativamente veloce. L’uso di tali architetture come forme di base per soluzioni computazionali a richieste più avanzate (ad esempio la memoria semantica, l’elaborazione di frasi) rispetta richieste di continuità per la codifica ed il recupero dell’informazione. Laddove il cognitivismo classico vedeva una serie di realizzazioni distinte, ognuna delle quali ha bisogno di un proprio modello computazionale, nei sistemi PDP possono semplicemente vedere modi diversi di alto livello per descrivere la stessa forma di elaborazione sottostante: il tentativo costante di dare al sistema la miglior configurazione in corrispondenza di vari input endogeni ed esogeni. Fissiamo il modo di codificare, aggiornare e recuperare l’informazione e otteniamo varie forme di generalizzazione, degrado graduale, assegnazione per difetto, estrazione di prototipi, tutte peculiarità dei processi distribuiti paralleli. “Appare dal modello PDP che molte delle distinzioni che vengono fatte a livello superiore riflettano i nostri interessi epistemologici senza ritagliare nessuna differenza nella sottostante forma computazionale o attività del sistema. (...) Le differenze risiedono non nella sottostruttura computazionale ma nella relazione della struttura con gli stati del mondo che colpiscono il soggetto” (Clark, 1994).
Naturalmente anche al modello connessionista vengono avanzate alcune critiche. Fodor e Pylyshyn (Clark, 1994) propongono l’argomento della sistematicità che può essere così brevemente riassunto:
1. il pensiero è sistematico;
2. allora le rappresentazioni interne sono strutturate;
3. i modelli connessionisti postulano rappresentazioni non strutturate;
4. dunque le spiegazioni connessioniste sono inadeguate come modelli cognitivi.
Si afferma invece che le spiegazioni classiche postulano rappresentazioni interne con ricche strutture sintattiche e semantiche. Esse così si inseriscono nelle pieghe cognitive precluse ai connessionisti.
Secondo Clark (Clark, 1994) noi ascriviamo una rete di pensieri per spiegare e descrivere una ricca varietà di risposte comportamentali. L’idea generale è che l’ascrizione di pensiero sia un processo astratto, idealizzante ed olistico, che quindi non deve necessariamente corrispondere in modo semplice ai dettagli di qualche elaborazione interna. In breve, non è necessario che vi sia un collegamento quasi riduttivo, biunivoco, netto e ordinato, tra l’elaborazione interna alla testa e le ascrizioni proposizionali di credenze e pensieri fatte nel linguaggio quotidiano. Al contrario, un rendiconto sofisticato dell’elaborazione interna deve spiegare un ricco corpo di comportamenti (esterni ed interni) a cui poi noi diamo un senso olistico ascrivendogli una rete sistematica di pensieri astratti. Concludendo, le strutture sono costruzioni fatte a posteriori, con l’occhio della mente, per organizzare e dare un senso, costruire una psicologia del senso comune, ad una attività “che non postula elementi interni ricorrenti che si allineano con le varie parti delle descrizioni a livello concettuale” (Clark, 1994). La sistematicità delle frasi che ascrivono pensiero è un fatto concettuale. Trovarvi i pensieri richiede che le frasi formino una rete fortemente strutturata. Ciò che non è un fatto concettuale è la sistematicità del comportamento che olisticamente garantisce le attribuzioni di pensiero. E questa è una caratteristica dei sistemi PDP. Un sistema PDP “...può esibire tutti i tipi di competenza comportamentale sistematica senza che quella competenza richieda spiegazioni in termini di composizionalità a livello concettuale”. Per farla breve la scintilla, il fuoco è la connessione, il movimento di eccitazione e inibizione della rete neurale è l’autorganizzazione della rete, la molecolarità del sistema, e non la struttura o la forma.

Nessun commento: