Gemini 3.5 Flash i Omni: Google I/O 2026 donosi dva nova modela

Google je na I/O 2026 predstavio Gemini 3.5 Flash model koji za $1.50/$9 po milion tokena tvrdi da premašuje skuplji Pro i radi 4x brže. Plus Gemini Omni: prima video, vraća video. Konkretni podaci za svakoga ko bira AI infrastrukturu.

20 maj. 2026

•

3 min

Autor: Vladimir Sukara

Gemini 3.5 Flash i Omni: Google I/O 2026 donosi dva nova modela

Flash koji tvrdi da premašuje Pro modele, i model koji prima video i vraća video. Google je postavio visoku letvicu za ostatak godine.

Na Google I/O konferenciji 2026, kompanija je predstavila dva nova Gemini modela koja direktno udaraju na pozicije Anthropica i OpenAI-a. Gemini 3.5 Flash dolazi s obećanjem: brži je od konkurencije, jeftiniji od prethodnih Pro modela i tvrdi da ih premašuje na ključnim testovima performansi. Gemini Omni ide korak dalje: prima video, audio, sliku i tekst, a kao output vraća video utemeljen u stvarnom razumijevanju sadržaja. Za firme koje odabiru AI infrastrukturu, ovo su konkretni podaci za poređenje.

Gemini 3.5 Flash: $1.50 za input / $9 za output po milion tokena, kontekst prozor od 1 milion tokena
Tvrdi da je 4x brži od konkurentnih modela u istoj klasi
Na testovima kodiranja i multimodalnih zadataka premašuje Gemini 3.1 Pro
Gemini Omni: prima video, audio, sliku i tekst kao output vraća video
Oba modela predstavljena na Google I/O 2026

Šta su ovi modeli i po čemu se razlikuju

Gemini 3.5 Flash je dizajniran za slučajeve gdje su bitni brzina i cijena ali bez žrtvovanja kvaliteta koji se inače veže uz Pro modele. Flash modeli su tipično jeftinija, brža varijanta s nešto manjim sposobnostima. Gemini 3.5 Flash ruši taj kompromis: Google tvrdi da na testovima kodiranja i multimodalnih zadataka (razumijevanje kombinacije teksta, slike, zvuka) premašuje vlastiti Gemini 3.1 Pro, koji je bio model za zahtjevne primjene.

Kontekst prozor od 1 milion tokena otprilike 750.000 riječi ili cijela kodna baza srednje veličine znači da model može raditi s ogromnim količinama podataka u jednom zahtjevu, bez potrebe za fragmentiranjem ili ručnim sažimanjem dokumentacije.

Gemini Omni rješava drugačiji problem. Dosad su AI modeli uglavnom primali više formata ali vraćali tekst ili sliku. Omni prima sve to i kao output generiše video, s naglaskom na to da je taj video utemeljen u stvarnom razumijevanju sadržaja, a ne puko generativno stvaranje bez konteksta.

Kontekst i konkurencija

Google I/O je godišnja konferencija gdje kompanija prikazuje šta dolazi i 2026. je posebno živo. Krajem prošle sedmice Anthropic je privukao Andreaja Karpathyja, jednog od najrespektiranijih AI istraživača. OpenAI priprema IPO. Google odgovara modelima koji kombinuju agresivnu cijenovnu poziciju s benchmark tvrdnjama koje inače viđamo samo uz skuplje modele.

Poređenje cijena je konkretno: OpenAI-ov GPT-5 je otprilike $2.50/$10 po milion tokena, Claude Sonnet oko $3/$15. Gemini 3.5 Flash na $1.50/$9 je ispod oba uz tvrdnju o boljim performansama. Ako ta tvrdnja izdrži nezavisno testiranje, ovo je ozbiljan argument za migraciju API projekata.

Gemini Omni nema direktan pandan kod konkurencije u ovom trenutku. Video output koji je "groundiran" (utemeljen u stvarnom sadržaju) znači da model razumije šta je u videu i gradi na tome umjesto da sintetizira nasumičan vizualni sadržaj.

Naša perspektiva: šta ovo znači za firme u regionu

Dvije konkretne prilike, zavisno od toga što radite.

Za razvojne timove i IT firme koje koriste AI API: Razlika između $2.50 i $1.50 po milion tokena za input direktno se reflektuje na troškove. Firma koja troši $500 mjesečno na AI API može, ako Gemini 3.5 Flash bude jednako dobar ili bolji za njen use case, isti posao obavljati za oko $300. Tačno poređenje zavisi od projekta, ali benchmark tvrdnje su dovoljno snažne da zaslužuju konkretno testiranje u narednih 30 dana a ne samo čitanje specifikacija.

Za marketinške agencije i content timove: Gemini Omni s video outputom je sposobnost bez pandana u ovom trenutku. Zamislite tok rada gdje učitate video klijentovog reklamnog spota i kao output dobijete novi video s izmjenama, alternativnim varijantama ili integrisanim podnaslovima ne kao opis, nego kao video fajl. Ako funkcioniše onako kako Google opisuje, ovo može eliminisati dio post-produkcijskog posla koji se danas radi ručno ili plaća eksternoj produkciji.

Za firme koje još nisu izabrale primarni AI API: sada postoji konkretan razlog da testiranje Gemini familije uđe na listu prioriteta za Q3.

Zaključak

Google je ovim modelima napravio jasan manevar uzeti cjenovnu prednost Flash kategorije i pomiješati je s performansama koje se inače plaćaju više. Gemini Omni s video outputom je kvalitativni skok koji konkretno nije viđen kod konkurencije u ovom trenutku. Naredne sedmice donijet će nezavisne benchmarke i realne testove to je trenutak kad se marketinške tvrdnje suoče sa stvarnošću.

Ako pratite koji AI model ili API odabrati za naredni projekat, pretplatite se na AI Balkan newsletter pratimo sve ključne promjene u realnom vremenu.

Prijavi se

Autor

Vladimir Sukara