Cercetătorii de la universitatea Cornell au dezvoltat ochelari inteligenţi care pot ajuta la îmbunătăţirea comunicării persoanelor mute sau cu dificultăţi de vorbire. Interfaţa de recunoaştere a vorbirii silenţioase utilizează detectarea acustică şi inteligenţa artificială pentru a recunoaşte până la 31 de comenzi nevorbite, pe baza mişcărilor buzelor şi ale gurii.
Interfaţa portabilă, botezată EchoSpeech, necesită doar câteva minute de date de antrenament pentru utilizator înainte de a recunoaşte comenzile şi poate fi rulată pe un telefon inteligent.
Ochelarii vor fi prezentaţi la conferinţa Societăţii pentru dispozitive computaţionale privind factorii umani în sistemele informatice (CHI), care va avea loc luna aceasta la Hamburg, în Germania.
„Pentru persoanele care nu pot vocaliza sunete, această tehnologie pentru vorbirea silenţioasă ar putea fi un input excelent pentru un sintetizator de voce. Ar putea să le redea vocea pacienţilor", a declarat Ruidong Zhang, doctorand în ştiinţa informaţiei şi autorul principal al lucrării, despre potenţialul de utilizare a tehnologiei în dezvoltări ulterioare.
În forma sa actuală, EchoSpeech ar putea fi utilizat pentru a comunica cu alte persoane prin intermediul unui smartphone în locuri în care vorbitul este incomod sau nepotrivit, cum ar fi un restaurant zgomotos sau o bibliotecă liniştită.
Interfaţa vocală silenţioasă poate fi, de asemenea, cuplată cu un stilou şi utilizată cu un software de proiectare, cum ar fi CAD, eliminând practic necesitatea unei tastaturi şi a unui mouse.
Dotaţi cu o pereche de microfoane şi difuzoare mai mici decât o gumă de şters, ochelarii EchoSpeech devin un sistem sonar portabil alimentat de inteligenţa artificială, care trimite şi primeşte unde sonore şi detectează mişcări ale corpului, feţei şi gurii.
Un algoritm de învăţare profundă analizează apoi aceste profile în timp real, cu o precizie de aproximativ 95%.
Dispozitivul miniatural are un consum redus de energie şi este sensibil la confidenţialitate, toate acestea fiind caracteristici importante pentru implementarea de noi tehnologii purtabile în lumea reală, spun autorii.
Majoritatea tehnologiilor de recunoaştere a vorbirii silenţioase se limitează la un set de comenzi prestabilite şi necesită ca utilizatorul să se afle cu faţa sau să poarte o cameră, ceea ce nu este nici practic, nici fezabil, spune Cheng Zhang.
Există, de asemenea, preocupări majore legate de confidenţialitate care folosesc camerele portabile, atât pentru utilizator, cât şi pentru cei cu care acesta interacţionează.
Tehnologiile de detectare acustică, precum EchoSpeech, elimină necesitatea camerelor video portabile, iar datele audio necesită o lăţime de bandă mai mică pentru a fi procesate şi pot fi transmise în timp real către un smartphone prin Bluetooth, a declarat François Guimbretière, profesor în ştiinţa informaţiei.
Şi pentru că datele sunt procesate local, pe smartphone, în loc să fie încărcate în cloud, „informaţiile sensibile din punct de vedere al confidenţialităţii sunt în controlul vorbitorilor", potrivit profesorului.
Un articol despre acest dispozitiv a fost publicat joi, în jurnalul universităţii, Cornell Chronicle.
(Foto articol: Ruidong Zhang, student la doctorat în domeniul ştiinţei informaţiei, purtând ochelarii EchoSpeech).