Creierul interpretează vorbirea pas cu pas asemănător modelului de inteligență artificială, descoperiri ale cercetătorilor

creierul-intelege-vorbirea-pas-cu-pas,-ca-un-model-de-inteligenta-artificiala.-ce-au-descoperit-cercetatorii creierul-intelege-vorbirea-pas-cu-pas,-ca-un-model-de-inteligenta-artificiala.-ce-au-descoperit-cercetatorii
Creierul înțelege vorbirea pas cu pas, ca un model de inteligență artificială. Ce au descoperit cercetătorii

Când asculți o poveste, ai impresia că „prinzi” sensul instantaneu: propozițiile curg iar mintea pare să țină pasul fără efort. Recent, un studiu evidențiază că, în spatele scenei, înțelegerea nu se produce ca un „clic” rapid, ci se construiește incremental, într-o succesiune de etape, asemănătoare funcționării modelelor avansate de inteligență artificială pentru limbaj.

Cercetătorii au monitorizat activitatea cerebrală în timp ce participanții ascultau un podcast de circa 30 de minute și au comparat „amprenta” neurală a procesului de înțelegere cu reprezentările interne generate de modele de tip GPT. Rezultatul arată că, pe măsură ce sensul se clarifică în creier, răspunsurile neurale se aliniază cu niveluri tot mai „profunde” ale unui model lingvistic. Concluzia este provocatoare: modul în care îți construiești înțelegerea din discurs ar putea fi mai „statistic” și mai dependent de context decât ai crede.

Metodologia utilizată pentru urmărirea evoluției sensului

Echipa condusă de Ariel Goldstein (Universitatea Ebraică din Ierusalim), în colaborare cu specialiști de la Google Research și Universitatea Princeton, a folosit electrocorticografia (ECoG) — o tehnică care măsoară electricitatea direct de la suprafața creierului prin electrozi implantați clinic. Principala avantajare a acestei metode este rezoluția temporară extrem de precisă: se poate observa aproape „cadru cu cadru” reacțiile creierului la fiecare cuvânt și la contextul acumulat.

Advertisement

În cadrul cercetării, participanții au ascultat o narațiune audio, iar cercetătorii au comparat semnalele ECoG cu reprezentări extrase din modele lingvistice avansate, precum arhitecturi de tip transformer, folosite în GPT-2 și Llama 2. Scopul a fost să se determine dacă momentul în care apar anumite modele cerebrale corespunde cu „adâncimea” stratului din model (straturi superficiale versus adânci).

Un aspect crucial a fost localizarea: corelarea între semnalele neurale tardive și straturile profunde ale modelelor a fost puternică în zone tradiționale ale limbajului, precum arie lui Broca. Acest fapt susține ideea că zonele implicate în procesarea sintaxei, intenției și înțelesului contextului procesează mai intens în timp ce propozițiile devin mai coerente și ambiguitățile se clarifică.

E foarte asemănător cu arhitectura rețelelor neuronale mari și contestă concepțiile tradiționale

Modelele de tip transformer funcționează pe mai multe niveluri: la început, procesează semnale mai simple, precum caracteristicile locale ale cuvintelor, apoi combină treptat informațiile pentru a realiza reprezentări dependente de context. În esență, același cuvânt poate avea înțelesuri diferite în funcție de fraza în care apare, iar această dependență devine mai evidentă în nivelele mai adânci ale modelului.

Studiul indică că și creierul urmează un model similar: semnalele accesate mai devreme se potrivesc mai bine cu nivelurile „superficiale” ale modelului, în timp ce semnalele ulterioare, cele care apar pe măsură ce propoziția capătă sens, seamănă mai mult cu nivelurile profunde. Aceasta reprezintă o provocare pentru perspectiva clasică, rigidă, asupra limbajului, conform căreia limbajul este o sumă de reguli aplicate mecanic: înțelegerea pare să fie, mai degrabă, o construcție probabilistică, care se rafinează continuu în funcție de context.

De asemenea, cercetătorii au testat și reprezentări tradiționale ale lingvisticii, precum foneme și morfeme, ca explicații pentru dinamica în timp real a semnalelor cerebrale, însă modelele moderne de procesare lingvistică prețuiesc mai bine variația observată, sugerând că creierul percepe limbajul nu prin etichete discrete, ci printr-o integrare continuă a contextului.

Este important de subliniat că această analogie trebuie interpretată cu prudență: modelele lingvistice nu au conștiință, emoții sau intenții, ci optimizează predicția statistică. Când se menționează corespondența între straturi și evoluția temporală, se face referire doar la similaritatea organizatorică a proceselor, nu la o identitate completă cu mecanismele biologice. Diferențele majore rămân evidente, atât în modalitatea de învățare, cât și în modul de corectare a erorilor.

Implicații pentru neuroștiință și inteligența artificială

Un aspect practic important este metoda de cercetare: dacă un model de limbaj generează reprezentări care pot anticipa activitatea cerebrală în timpul ascultării, atunci acel model devine un instrument valabil de analiză în laborator. În loc să te bazezi pe ipoteze despre „unitățile” lingvistice, poți compara direct diverse modele și straturi pentru a determina care descrie cel mai bine datele neuronale în timp real.

Proiectul a dus la publicarea unui set de date ECoG pentru ascultarea unui podcast, destinată comunității științifice, facilitând testarea de ipoteze și verificarea rezultatelor. Astfel de date naturale sunt rare în domeniul neuroștiinței limbajului, fiind în general obținute în contexte clinice, motiv pentru care standardizarea și distribuirea lor sunt valoroase pentru cercetare.

Această abordare deschide un „pod” între modelele de inteligență artificială și mecanismele biologice, contribuind la înțelegerea procesului de interpretare a limbajului în timp real. În viitor, aceste descoperiri pot influența atât dezvoltarea algoritmilor, cât și aplicațiile medicale, precum interfețele neuronale și evaluarea tulburărilor de limbaj.

Este crucial de menționat însă că datele provin dintr-un număr mic de participanți, în contexte clinice, și corelarea observată nu implică neapărat o identitate completă a mecanismelor. Cu toate acestea, constatările indică o posibilă convergență a modului în care limbajul este procesat atât în cortex, cât și în modelele de inteligență artificială, proces care, pentru limbaj, trebuie să includă pas cu pas procesarea în straturi de context tot mai adânci.

Add a comment

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Fiți la curent cu cele mai importante știri

Apăsând butonul Abonare, confirmați că ați citit și sunteți de acord cu Politica noastră de confidențialitate și Termenii de utilizare
Advertisement