Meta's Brain2Qwerty v2 dekodira rečenice iz mozga bez operacije
Meta AI objavio je nadogradnju modela koji pretvara moždanu aktivnost u tekst u realnom vremenu, bez hirurških implantata. Srednja tačnost dostiže 61%, a kod najboljeg učesnika 78%. Do klinike je još daleko. Ali zakoni skaliranja važe i ovdje.
Svake godine hiljade ljudi izgubi sposobnost govora nakon moždanog udara, nesreće ili neurološke bolesti. Ranije je obnavljanje komunikacije gotovo uvijek podrazumijevalo mozgove implantate i otvorenu operaciju lubanje.
Meta AI pokušava promijeniti tu jednačinu.
Juče su objavili Brain2Qwerty v2, model koji čita moždanu aktivnost bez ijednog reza i u realnom vremenu rekonstruiše rečenice koje je osoba imala namjeru napisati.
Kako sistem funkcioniše
Brain2Qwerty v2 koristi MEG skener (magnetoencefalograf) koji mjeri elektromagnetske promjene u mozgu dok osoba tipka. Model uzima te zapise i, kroz tri uzastopna modula, rekonstruiše slova, riječi i na kraju cijele rečenice.
Prva verzija Brain2Qwerty nije mogla raditi u realnom vremenu jer joj je trebala precizna vremenska oznaka svakog pritiska tipke. Druga verzija to više ne traži. Radi na kontinuiranom toku moždane aktivnosti i generiše tekst direktno iz njega.
Na kraju lanca nalazi se veliki jezički model koji koristi kontekst da premosti jaz između nesavršenih neuralnih zapisa i koherentne rečenice.
Šta kažu brojke
Meta je za trening v2 koristila deseterostruko više podataka nego za prvu verziju: oko 22.000 rečenica po ispitaniku, snimljenih tokom deset sati po svakom od devet volontera.
Rezultat je srednja tačnost na nivou riječi od 61%. Kod najboljeg učesnika ta cifra dostiže 78%, a više od polovine svih rečenica dekodovano je s najviše jednom greškom po rečenici.
Za poređenje, nijedna dotadašnja neinvazivna metoda nije prelazila 8% tačnosti na ovom nivou. I prva verzija Brain2Qwerty imala je srednju tačnost oko 40%.
Napredak je mjerljiv i značajan.
Šta još ne radi
Istraživači ne skrivaju ograničenja. Dva problema ostaju nerješena.
Prvo, preciznost od 61% nije dovoljno visoka za svakodnevnu upotrebu. Sistem i dalje pravi previše grešaka na nivou slova i riječi da bi bio praktičan komunikacijski alat.
Drugo, MEG uređaj koji su koristili u istraživanju je veliki stacionarni skener, vrsta opreme dostupne samo u specijalizovanim istraživačkim centrima, daleko van dometa prosječnih klinika ili bolnica.
Gdje leži potencijal
Ono što istraživači naglašavaju je ono što u AI istraživanju zovemo zakonom skaliranja. Što je više podataka korišćeno za trening, to su bolji rezultati, i za sada nije detektovan plato tog poboljšanja. To znači da bi daleko veći skupovi podataka vjerovatno donijeli daleko bolju preciznost.
Paralelno, MEG tehnologija se razvija. Neke laboratorije već rade na nosivim MEG senzorima koji bi mogli biti praktičniji u kliničkim uvjetima.
Otvorena nauka
Istraživači su objavili kompletan kod za v1 i v2 na GitHubu. Baskijski centar za kognitivne nauke i jezik (BCBL), koji je sarađivao na projektu, objavio je skup podataka za v1 na HuggingFace platformi. Skup podataka za v2 čeka na objavljivanje u naučnom časopisu.
Prva verzija Brain2Qwerty prihvaćena je za publiciranje u Nature Neuroscience, jednom od najprestižnijih časopisa u neuroznanosti.
Naša perspektiva
Brain2Qwerty v2 nije alat koji ćete koristiti sutra. To je istraživačka studija sa devet ispitanika, velikim stacionarnim skenerom i preciznošću koja još nije dovoljna za kliničku primjenu. Istraživači to sami kažu.
Ali vrijedi primijetiti šta Meta ovdje zapravo radi. Kompanija čiji osnovni poslovni model počiva na oglasima i algoritmima za preporuku sadržaja ulaže ozbiljne istraživačke resurse u neinvazivne mozgovno-kompjuterske interfejse. To nije slučajnost. To je dugoročna opklada na to gdje će biti granica između čovjeka i mašine.
Neurointerfaces su danas tamo gdje je razgovorni AI bio 2018: sporog napretka, skupi i daleko od masovne primjene. Tada je malo ko mislio da će za šest godina razgovorni AI biti u svakom pametnom telefonu.
Zakoni skaliranja važe i ovdje. Meta ih i sama potvrđuje. Više podataka, bolji rezultati, bez vidljivog platoa.
Za one koji prate razvoj AI u kontekstu budućih korisničkih sučelja i pristupačnih tehnologija, Brain2Qwerty v2 je tačka za bilježenje. Za ostatak poslovne zajednice, poruka je jednostavnija: granica između čovjeka i mašine neće zauvijek ostati ekran i tipkovnica.