Neuroinginerii de la Columbia University au creat un sistem care traduce gândul într-un discurs inteligibil şi uşor de recunoscut. Acesta este un pas important în construirea interfeţelor creier-computer, care reprezintă o speranţă pentru persoanele fără capacitatea de a vorbi.
Prin monitorizarea activităţii creierului, tehnologia poate reconstitui cuvintele pe care le aude o persoană cu o claritate fără precedent. Această descoperire, care exploatează puterea sintetizatoarelor de vorbire şi a inteligenţei artificiale, ar putea duce la noi modalităţi prin care computerele să comunice direct cu creierul. De asemenea, pune bazele ajutorării oamenilor care nu pot vorbi, cum ar fi cei care trăiesc cu scleroză laterală amiotrofică sau se recuperează după un accident vascular cerebral, să îşi recapăte capacitatea de a comunica cu lumea exterioară.
”Vocile noastre ne ajută să ne conectăm la prietenii, familie şi lumea din jurul nostru, motiv pentru care pierderea vocii din cauza rănirii sau a bolii este atât de devastatoare. Prin studiul de astăzi, avem o cale posibilă de o a restabili. Am arătat că, cu tehnologia potrivită, gândurile acestor oameni ar putea fi decodificate şi înţelese de orice ascultător”, a declarat dr. Nima Mesgarani, de la Columbia University, autorul principal al lucrării, citată de sciencedaily.com.
Decenii de cercetare au arătat că, atunci când oamenii vorbesc sau îşi imaginează că vorbesc în creier se manifestă anumite tipare. Un model distinct al semnalelor apare şi atunci când ascultăm pe cineva vorbind sau ne imaginăm ascultarea.
Eforturile anterioare pentru a decoda semnalele s-au axat pe programe de calculatoar care au analizat spectrogramele, reprezentări ale frecvenţelor sonore. Dar această abordare nu a reuşit să producă nimic asemănător cu un discurs inteligibil.
Din acest motiv cercetătorii au creat ”vocoder”, un algoritm de calculator care poate sintetiza discursul după ce a fost instruit pe baza înregistrărilor vorbitorilor.
”Aceasta este aceeaşi tehnologie folosită de Amazon Echo şi Apple Siri pentru a da răspunsuri verbale la întrebările noastre”, a mai adugat spus dr. Mesgarani.
Pentru a învăţa vocoderul să interpreteze activitatea creierului, Dr. Mesgarani a colaborat cu Ashesh Dinesh Mehta, un neurochirurg de la Northwell Health Physician Partners Neuroscience Institute care tratează pacienţii cu epilepsie, dintre care unii trebuie să sufere operaţii regulate.
”Lucrând cu Dr. Mehta, am cerut pacienţilor cu epilepsie deja supuşi unei intervenţii chirurgicale cerebrale să asculte propoziţiile rostite de diferite persoane, în timp ce am măsurat tiparele activităţii creierului. Aceste modele neuronale au antrenat vocoderul” a adugat dr. Mesgarani. "
Apoi, cercetătorii au cerut aceloraşi pacienţi să asculte difuzoarele care recitau cifre între 0 şi 9, în timp ce semnalele semnalului creierului ar fi putut fi rulate prin vocoder. Sunetul produs de vocoder ca răspuns la aceste semnale a fost analizat şi curăţat de reţelele neuronale, un tip de inteligenţă artificială care imită structura neuronilor din creierul biologic.
Rezultatul final a fost o voce robotizată care recită o serie de numere. Pentru a testa acurateţea înregistrării, Dr. Mesgarani şi echipa sa au însărcinat indivizii să asculte înregistrarea şi să raporteze ceea ce au auzit.
”Am descoperit că oamenii ar putea înţelege şi repeta sunetele în aproximativ 75% din timp, ceea ce este mult peste şi dincolo de orice încercări anterioare”, a concluzionat dr. Mesgarani.
Cercetătorii planifică să testeze mai multe cuvinte şi propoziţii mai complexe şi vor să efectueze aceleaşi teste pe semnalele creierului emise atunci când o persoană vorbeşte sau îşi imaginează că vorbeşte. În viitor ei speră că sistemul lor ar putea face parte dintr-un implant, similar cu cel purtat de unii pacienţi cu epilepsie, care transpune gândurile purtătorului în cuvinte.