Revolucionarna studija Google-a i MIT-a ruši mit o AI agentima: "Više" nije uvijek "bolje"
Prvi zakoni skaliranja za agentske sisteme otkrivaju "porez na koordinaciju" koji guši efikasnost i povećava troškove.
U jeku "agentske groznice", gdje se kompanije utrkuju ko će implementirati složenije sisteme sa više AI agenata, stiglo je otrežnjenje. Revolucionarna studija koju su sproveli Google Research i MIT direktno izaziva preovlađujuću mantru da je "više agenata rješenje za sve".
Kroz 180 kontrolisanih eksperimenata na glavnim porodicama modela, istraživači su izveli prve kvantitativne zakone skaliranja za agentske sisteme. Nalazi su jasni: dok dodavanje više agenata na problem može poboljšati performanse u specifičnim scenarijima, često dovodi do onoga što su nazvali "porez na koordinaciju" (coordination tax), koji drastično obara efikasnost i tačnost u drugim zadacima.
Zakoni skaliranja: Gdje sistemi pucaju?
Studija je otkrila nekoliko kritičnih tačaka u razvoju multi-agentskih sistema:
- Paralelno vs. Sekvencijalno: Centralizovani sistemi sa više agenata poboljšali su finansijsku analizu za impresivnih 81%. Međutim, kod zadataka koji zahtijevaju sekvencijalno planiranje (poput igranja Minecrafta), performanse su pale za čak 70%.
- Zasićenje sposobnosti: Koordinacija donosi sve manje ili čak negativne rezultate onog trenutka kada pojedinačni agent dostigne stopu uspješnosti od 45% samostalno. Nakon te tačke, dodavanje "pomagača" često samo smeta.
- Pojačavanje grešaka: Bez stroge centralizovane koordinacije, nezavisni agenti pojačavaju greške za nevjerovatnih 17.2 puta u poređenju sa osnovnim modelom jednog agenta.
"Token Tax": Cijena kompleksnosti
Možda najvažniji nalaz za preduzeća tiče se troškova i efikasnosti. Studija uvodi pojam "Porez na tokene".
Pojedinačni agenti su u prosjeku uspješno obavljali 67 zadataka na 1,000 tokena. Nasuprot tome, složeni hibridni timovi agenata uspjeli su obaviti samo 14 zadataka za istu količinu resursa, zbog ogromnog "overhead-a" potrebnog za njihovu međusobnu koordinaciju.
Kraj faze pokušaja i grešaka?
Ovo istraživanje sugeriše da trenutni "agentski hajp" gura kompanije ka nepotrebno složenim arhitekturama. Za zadatke koji zahtijevaju duboko rezonovanje korak-po-korak, jedan, dobro kalibrisan agent ostaje "zlatni standard" i za pouzdanost i za troškovnu efikasnost.
Ova studija označava prelazak sa faze pokušaja i grešaka u razvoju agenata na disciplinovanu, prediktivnu nauku. Razvojni timovi sada moraju donijeti ključnu odluku: grade li elegantnog, efikasnog specijalistu ili "naduvani komitet" koji troši više vremena na dogovaranje nego na rad?