Sutskever izaziva industriju: Zašto AI možda mora rasti u širinu, a ne u visinu
Rastući broj vodećih AI stručnjaka dovodi u pitanje dugogodišnju opsesiju skaliranjem velikih jezičkih modela i sugeriše da bi budućnost mogla ležati u potpuno drugačijem pristupu.
U razgovoru s Dwarkeshom Patelom prošle sedmice, Ilya Sutskever, suosnivač OpenAI-ja i osnivač Safe Superintelligencea, izazvao je jedan od najvećih aksioma moderne AI industrije: uvjerenje da veći modeli uvijek znače bolje modele. Prema njegovim riječima, 2020. godina označila je prelazak iz „doba istraživanja” u „doba skaliranja”, gdje je inovacija ustupila mjesto pukom uvećavanju parametara. Danas, kaže Sutskever, vraćamo se istraživanju samo s mnogo većim računarima.
Šta dovodi u pitanje opsesiju veličinom?
Iako je „bigger is better” pristup i dalje najstabilnija investicijska strategija, Sutskever tvrdi da sve više istraživača shvata da granice skaliranja nisu beskonačne. On nije usamljen. Yann LeCun upozorio je da LLM-ovi neće dovesti do ljudskog nivoa inteligencije, a Benjamin Riley ističe da je jezik samo alat za razmišljanje, ne i sama misao.
Zašto se ponovo okrećemo svijetu van teksta?
Skepticizam prema hiper-skaliranju dolazi u trenutku kada raste interesovanje za „world modele” i robotiku AI sisteme koji razumiju prostor, fizički svijet i kontekst, a ne samo jezik.
U novembru je Fei-Fei Li predstavila Marble, komercijalni world model fokusiran na prostornu inteligenciju. PAN, novi model istraživača s Mohamed bin Zayed univerziteta, dodatno je podigao očekivanja. Startup Physical Intelligence prikupio je čak 600 miliona dolara, što pokazuje da investitori vjeruju u AI koji se kreće, opaža i djeluje ne samo generiše tekst.
Posljedice za industriju i korisnike
Ako se industrija zaista udalji od čiste logike skaliranja, posljedice mogu biti ogromne. Tržište se već oslanja na pretpostavku da će mega-centri podataka i trilionska ulaganja nastaviti davati proporcionalne rezultate. No, istraživanja pokazuju da manji modeli u specifičnim zadacima često nadmaše velike i pritom su jeftiniji, brži i energetski manje zahtjevni.
Za kompanije i institucije na Balkanu to znači novu eru prilika: specijalizovani modeli koji rješavaju konkretne zadatke, poput pravne analitike, medicinskih upita ili industrijske automatizacije, mogli bi biti isplativiji i relevantniji od generičnih, gigantskih modela.
Šta slijedi?
U narednih nekoliko godina očekuje se prelazak industrije iz čiste faze skaliranja u fazu „kombinovane inteligencije“, gdje se veliki modeli koriste za široke zadatke, a manji, precizno trenirani modeli preuzimaju domene u kojima dubinsko znanje i učinkovitost donose više vrijednosti.
Uz rast ulaganja u world modele, robotiku i multimodalne sisteme, 2026. bi mogla biti ključna godina preloma godina u kojoj će AI početi bolje razumijevati fizički svijet, a ne samo jezičke obrasce.
Koje prepreke stoje na putu?
Najveći izazovi dolaze iz tri pravca:
1. Ograničenja podataka i energije
Trenutni LLM-ovi približavaju se plafonu korisnih podataka dostupnih na internetu. Skaliranje kroz parametre postaje sve skuplje, a energetski troškovi rastu brže od performansi.
To znači da industrija mora pronaći nove izvore znanja simulacije, senzorske podatke, robotiku i bogate fizičke interakcije.
2. Dugoročna održivost data centara
Trilionske investicije u GPU infrastrukturu oslanjaju se na vjerovanje da će skaliranje i dalje donositi proporcionalne dobitke. Ako se pokaže da se koristi poravnavaju ili čak smanjuju, doći će do velikog preispitivanja strategija kompanija, pa i regulatornih tijela.
3. Tehnička kompleksnost world-model pristupa
Modeli koji razumiju prostor, uzrok i posljedicu, fiziku i dinamiku svijeta znatno su teži za razvijanje od jezičkih modela. Zahtijevaju robotiku, simulacije, nove arhitekture i potpuno nove evaluacijske okvire.
Ovo usporava razvoj, ali istovremeno otvara vrata za fundamentalne inovacije.
Kuda AI industrija zapravo ide?
Sudeći po trendovima, AI se kreće u smjeru:
1. Manjih, specijalizovanih modela koji rade zajedno
Umjesto jednog ogromnog modela koji radi sve, očekuje se rast „AI ekosistema“ velikog modela za generalne zadatke i niza malih eksperata za domenske probleme.
To je posebno važno za industriju, medicinu, pravni sektor i tehničke oblasti.
2. AI koji razumije i interaguje sa fizičkim svijetom
Robotika, world modeli, digitalni tvining i prostorna inteligencija postaju ključni stubovi razvoja.
AGI, prema sve više stručnjaka, vjerovatno neće biti čista tekstualna inteligencija, već kombinacija senzorne percepcije, prostornog razumijevanja i adaptivnog odlučivanja.
3. Efikasnije, održivije AI platforme
Energetski pritisak natjeraće industriju ka efikasnim modelima, novim arhitekturama, adaptivnom učenju i sistemima koji ne zahtijevaju beskrajno skaliranje računa.
4. AI kao infrastrukturni sloj društva
U narednih 5-10 godina AI neće biti samo alat, već nevidljiva infrastruktura u obrazovanju, državnim sistemima, proizvodnji, transportu i upravljanju podacima.
To znači da će „mali modeli“ vjerovatno imati jednako veliku, ako ne i veću ulogu od velikih.