Google lansirao Gemini 2.5 Flash Image: moćan AI editor slika

Google lansirao Gemini 2.5 Flash Image: moćan AI editor slika

Nova generacija uređivanja fotografija — tekstom mijenjate pozadinu, odjeću i stil, a lice ostaje isto

Google je 26. avgusta 2025. predstavio novi model za uređivanje slika u Gemini aplikaciji koji održava identitet osoba i kućnih ljubimaca, kombinuje više fotografija u jednu i podržava višekorak editing — sve putem običnog tekstualnog prompta. Funkcija je dostupna u Gemini aplikaciji, a napredne mogućnosti stižu i kroz API za developere. blog.googleGeminiGoogle Developers Blog

Šta je novo: 2.5 Flash Image “nano-banana”

Google je uveo model Gemini 2.5 Flash Image (interni nadimak “nano-banana”) koji donosi precizne lokalne izmjene, bolju konzistentnost lika i spajanje više ulaznih fotografija u jednu scenu. Razvijen je na bazi Gemini tehnologije i dostupan u Gemini aplikaciji, Google AI Studio i Vertex AI. Google Developers BlogGoogle DeepMind

Kako radi: editujete tekstom, spajate fotografije

Korisnik može: promijeniti pozadinu, ukloniti objekte, mijenjati odjeću, restaurirati stare fotografije, aplicirati stil jedne slike na objekat na drugoj i kombinovati do tri slike u novu kompoziciju kroz više uzastopnih uputa, bez gubitka detalja na licu. Sve generisane ili uređene slike nose vidljiv watermark i nevidljivi SynthID markér. blog.googleGoogle DeepMind

Zašto je bitno: identitet ostaje isti

Glavna novost je dosljednost izgleda osobe ili ljubimca kroz niz izmjena i scena, što je bio čest problem prethodnih AI editora. Google navodi da je model već najbolje rangiran na relevantnim listama za uređivanje slika. blog.google

Dostupnost, cijena i sigurnost

U Gemini aplikaciji mogućnosti su dostupne “od danas”, dok je za developere model u previewu kroz Gemini API/AI Studio i u Vertex AI. Cijena za API je 30 USD po milion izlaznih tokena; jedna slika obračunava se kao 1.290 tokena (≈0,039 USD po slici). Sve slike su označene SynthID-om radi transparentnosti i suzbijanja dezinformacija. Google Developers Blog

„Reimagine your photos with a prompt“, stoji u zvaničnim release notesima uz naglasak na spajanje više slika i bolje praćenje instrukcija. Gemini
„Model omogućava ciljane transformacije i precizne lokalne izmjene prirodnim jezikom“, navodi Google Developers Blog. Google Developers Blog

Brze činjenice (Fact-box)

Pozadina: val AI uređivanja slika

Google je još u aprilu počeo da uvodi nativno uređivanje unutar Gemini aplikacije; novo izdanje znatno širi mogućnosti i kvalitet, a dolazi usred trenda integracije AI editora u popularne alate i servise. 9to5Google

Zaključak: šta slijedi

Očekuje se brzo širenje kreativnih i poslovnih upotreba od marketing vizuala i e-trgovine do izrade sličica i mockupa uz paralelno jačanje bezbjednosnih mjera i označavanja sadržaja. Google najavljuje dalja poboljšanja konzistentnosti i činjenica u slikama te stabilno izdanje modela u narednim sedmicama.

Read more