NVIDIA Nemotron 3 Super cilja skupe i spore AI agente
NVIDIA je predstavila Nemotron 3 Super, otvoreni 120B hibridni model za agentni AI rad. Glavni aduti su 1M tokena konteksta, veća propusnost, optimizacija za Blackwell i deployment kroz NVIDIA NIM.
Novi otvoreni model iz NVIDIA-e donosi hibridnu Mamba-Transformer arhitekturu, 1 milion tokena konteksta i fokus na brže, preciznije agentne zadatke.
NVIDIA je predstavila Nemotron 3 Super kao novi open-weight model namijenjen agentnom AI radu, sa ukupno oko 120 milijardi parametara i oko 12 milijardi aktivnih parametara u MoE režimu. Firma tvrdi da je model napravljen da riješi dva ključna problema modernih AI agenata, rast troškova pri dugim zadacima i gubitak fokusa kada kontekst postane ogroman. Model je dostupan preko build.nvidia.com, a NVIDIA ga pozicionira za razvoj autonomnih radnih tokova, istraživačkih alata i softverskih agenata.
- Nemotron 3 Super je 120B hibridni MoE model sa oko 12B aktivnih parametara.
- NVIDIA navodi do 1M tokena konteksta, što je važno za duge zadatke, velike kodne baze i obimne izvještaje.
- Arhitektura kombinuje Mamba i Transformer slojeve radi boljeg odnosa između brzine i rezonovanja.
- Firma tvrdi da model nudi do 5x veći throughput i do 2x bolju tačnost u odnosu na prethodnike u Nemotron liniji.
- Model je optimizovan za Blackwell i NVFP4, uz podršku za deployment kroz NVIDIA NIM.
Šta je NVIDIA Nemotron 3 Super
Nemotron 3 Super je, prema zvaničnim NVIDIA materijalima, otvoreni hibridni Mamba-Transformer Mixture-of-Experts model za agentno rezonovanje, planiranje, coding i tool calling. Tehnički izvještaj navodi 120,6 milijardi ukupnih parametara i ograničen aktivni budžet od približno 12,7 milijardi, što znači da model ne “pali” cijelu mrežu pri svakom tokenu, nego samo dio eksperata koji su potrebni za konkretan zadatak. To je ključan razlog zašto NVIDIA insistira na boljoj cijeni po zahtjevu i većoj propusnosti.
Najjači tehnički adut je kombinacija Mamba slojeva, koji su efikasniji za obradu dugih sekvenci, i Transformer slojeva, koji i dalje ostaju važni za kvalitetno rezonovanje i rad sa složenim instrukcijama. NVIDIA dodatno ističe latentni MoE i multi-token prediction, gdje model pokušava predviđati više narednih tokena odjednom kako bi ubrzao inferenciju.
Još važnije za poslovnu upotrebu, Nemotron 3 Super podržava kontekst od 1 milion tokena. U praksi to znači da agent može držati u radnoj memoriji velike repozitorije koda, dugačke pravne ili finansijske dokumente i obimne istraživačke materijale, bez čestog rezanja sadržaja u manje dijelove. NVIDIA to predstavlja kao rješenje za problem “goal drift”, odnosno situacije kada agent tokom dugog zadatka izgubi cilj ili zaboravi ranije bitne informacije.
Analiza
NVIDIA tvrdi da Nemotron 3 Super donosi do 5 puta veći throughput i do 2 puta bolju tačnost u odnosu na ranije generacije Nemotron modela za agentne tokove rada. Te tvrdnje dolaze iz NVIDIA-inih vlastitih benchmark i promotivnih materijala, pa ih treba čitati kao tvrdnje proizvođača, ali su dovoljno jasne da pokažu smjer: manje aktivnih parametara, veći kontekst i agresivna optimizacija za inferenciju.
Posebno je zanimljiva optimizacija za Blackwell arhitekturu i NVFP4 preciznost. NVIDIA navodi da upravo tu želi pokazati prednost vertikalne integracije: isti proizvođač pravi čip, softverski stack i model. To je važna poruka za firme koje žele visoke performanse u produkciji, ali i signal da će puni efekat ovog modela vjerovatno najviše osjetiti korisnici već vezani za NVIDIA infrastrukturu.
Dostupnost preko build.nvidia.com, Hugging Face, OpenRoutera i kroz NVIDIA NIM mikroservise dodatno širi domet modela. To znači da Nemotron 3 Super nije zamišljen samo kao istraživački demo, nego kao alat koji treba brzo ubaciti u postojeće razvojne i poslovne tokove.
Konkurencija i tržište
Na tržištu sada postoji sve veći broj modela koji ciljaju “agentic AI” segment: OpenAI modeli za reasoning, Anthropic sa dugim kontekstom i sigurnijim poslovnim primjenama, Google sa Gemini linijom i otvoreniji kineski modeli poput DeepSeek-a i Alibabinih rješenja. U tom kontekstu, NVIDIA pokušava zauzeti specifičnu poziciju ne samo da prodaje GPU-e, nego i da nudi vlastiti model koji je duboko prilagođen njenom hardveru i deployment stacku.
To je strateški važan pomak. Ako se tržište pomjera prema AI agentima koji rade nad velikim internim bazama znanja, kodom i dokumentima, onda više nije dovoljno imati samo “pametan” model. Bitni su i throughput, cijena po zadatku, memorijski zahtjevi i mogućnost stabilnog rada u produkciji. Nemotron 3 Super ulazi upravo u taj prostor, gdje se modeli ne mjere samo po chat kvalitetu nego po tome koliko dobro obavljaju dugačke, višekoračne zadatke.
Naša perspektiva
Za firme i poslovne korisnike u regionu, ova objava je važnija nego što na prvi pogled djeluje. Većina kompanija u BiH, Srbiji i regionu nema budžet da trenira sopstvene foundation modele, ali ima vrlo konkretan interes da izgradi AI agente za internu pretragu dokumenata, obradu tendera, analizu ugovora, podršku korisnicima, razvoj softvera i istraživački rad. Model sa 1M tokena konteksta i fokusom na efikasnost može biti korisniji od “veće” alternative koja je skuplja za pokretanje.
Za razvojne timove, posebno je bitna kombinacija otvorenih težina, NIM deploymenta i podrške kroz širi NVIDIA ekosistem. To može smanjiti vrijeme od testiranja do produkcije, pod uslovom da firma već koristi NVIDIA infrastrukturu ili cloud okruženje optimizovano za nju. U praksi, to znači da regionalne IT firme, integratori i AI konsultanti dobijaju još jedan ozbiljan alat za enterprise projekte, posebno tamo gdje su privatnost podataka i lokalno hostovanje važni.
Za krajnje korisnike koji AI koriste za posao, najveći efekat neće biti u samom nazivu modela nego u kvalitetu proizvoda koji će tek nastati na njemu. Ako Nemotron 3 Super ispuni obećanja o boljoj tačnosti i manjem “lutanja” tokom dugih zadataka, mogli bismo vidjeti bolju generaciju poslovnih copilot rješenja za pravne timove, finansije, istraživanje i softverski razvoj.
Zaključak
Nemotron 3 Super pokazuje da se trka u AI industriji sve manje vodi samo oko “najvećeg modela”, a sve više oko korisnog kompromisa između tačnosti, cijene i brzine. NVIDIA ovdje igra na svoju najjaču kartu: spajanje modela i hardvera u jedinstven proizvodni paket. Ako se ovaj pristup pokaže uspješnim u stvarnim enterprise scenarijima, mogli bismo gledati još jači zaokret tržišta prema specijalizovanim, efikasnim modelima za agente, umjesto prema univerzalnim i preskupim gigantima.