Svjetski modeli mogli bi postati budućnost AI-ja

Svjetski modeli mogli bi postati budućnost AI-ja

Istraživači iz MBZUAI-ja tvrde da je sljedeći korak u razvoju vještačke inteligencije pomjeranje fokusa sa jezika na razumijevanje stvarnog svijeta.

Današnji najpopularniji AI sistemi briljiraju u radu s tekstom, ali često zakazuju kada se suoče sa fizičkim svijetom. Iako dobro rješavaju zadatke bazirane na riječima i brojevima, većina modela ne razumije fiziku, uzročnost i promjene stanja, što dovodi do realnih problema: autonomna vozila i dalje ne savladavaju opasne edge case situacije, a industrijski roboti zahtijevaju ogromne količine treninga da ne bi oštetili objekte ili povrijedili ljude oko sebe.

Ovaj jaz nastaje zato što ovi modeli ne mogu da povežu ono što vide sa onim što je zaista stvarno.

Zašto su svjetski modeli važni?

Tim istraživača iz Institute of Foundation Models (IFM) pri Mohamed bin Zayed University of Artificial Intelligence (MBZUAI), sa sjedištima od Abu Dabija do Silicijumske doline, radi upravo na tome da to promijeni. Njihov cilj su svjetski model sistemi koji ne samo da posmatraju, već i razumiju i predviđaju kako se svijet mijenja.

“Naš svjetski model je dizajniran da omogući AI-ju da razumije i zamišlja kako svijet funkcioniše ne samo na osnovu onoga što vidi, nego i na osnovu toga šta bi moglo da se desi sljedeće,” rekao je Hector Liu, direktor IFM Silicon Valley Laba.

Za razliku od klasičnih LLM-ova, koji prvenstveno predviđaju riječi, svjetski modeli razvijaju tzv. spatial intelligence sposobnost prostora, objekata, dinamike i akcija, o kojoj govori i dr. Fei-Fei Li sa Stanforda.

U čemu je razlika između video modela i svjetskih modela?

Liu ističe ključnu razliku: video generatori kao što su Sora, Veo ili Grok Imagine kreiraju vizuelno uvjerljive scene, ali ne razumiju njihovu unutrašnju logiku.

Svjetski modeli ne renderuju samo izgled oni simuliraju realnost.

Dok video generator samo prikazuje scenu, svjetski model održava unutrašnje stanje okruženja i simulira kako se ono mijenja tokom vremena. Može predvidjeti kako će se objekti kretati, kako će reagovati na akcije, i koje posljedice određena intervencija ima na sistem.

“Predviđa kako se scene razvijaju i kako reaguju na djelovanje ili promjene, umjesto da samo generiše kako izgledaju,” kaže Liu. Po prirodi su interaktivni i reaktivni mogu da se ponašaju kao agenti u simulisanom svijetu.

Moguće posljedice za industriju

Ako se svjetski modeli pokažu uspješnim, oni bi mogli postati temelj autonomnih sistema, robotike, naprednih AI agenata i digitalnih tvinskih simulacija. Rješavanje edge case problema u samovožnji, realnih interakcija robota i kompleksnih fizičkih simulacija moglo bi postati rutinsko.

U narednim mjesecima očekuje se sve veće ulaganje tehnoloških kompanija u razvoj modela koji razumiju stvarnost, a ne samo jezičke obrasce.

Read more

OpenAI lansirao Shopping Research novi AI asistent mijenja online kupovinu

OpenAI lansirao Shopping Research novi AI asistent mijenja online kupovinu

ChatGPT dobija specijalizovanog asistenta koji kreira personalizovane vodiče za kupovinu u samo nekoliko minuta. OpenAI je predstavio Shopping Research, interaktivni shopping asistent unutar ChatGPT-a koji skenira provjerene maloprodajne izvore i postavlja ciljane preference kako bi kreirao personalizovane vodiče za kupovinu. Novi pristup kupovini uz GPT-5 mini Shopping Research pokreće prilagođena

By AI Balkan