OpenAI lansirao AI prevodilac i transkripciju u realnom vremenu

OpenAI je objavio dva modela koji prevode govor u realnom vremenu sa 70+ jezika i transkribuju razgovor dok govornik priča. Cijena: dva centa po minuti za prevod. Za firme u regionu koje rade sa inostranim klijentima, jezička barijera upravo je postala znatno jeftinija.

Share
OpenAI lansirao AI prevodilac i transkripciju u realnom vremenu
OpenAI GPT Realtime Translate, AI prevođenje govora u realnom vremenu za poslovnu komunikaciju

Dva nova modela pretvaraju jezičku barijeru u riješen problem za firme koje rade sa inostranim klijentima.

OpenAI je 7. maja objavio dva nova modela kroz svoj Realtime API GPT-Realtime-Translate za prevođenje govora u realnom vremenu i GPT-Realtime-Whisper za live transkripciju dok govornik priča. Oba modela su namijenjena developerima koji grade poslovne aplikacije za komunikaciju, korisničku podršku i međunarodnu saradnju.

Za firme u regionu koje rade sa klijentima iz inostranstva ili imaju višejezične timove, ovo je prvi put da AI nudi kvalitetan simultani prevod po cijeni koja je mjerljiva u centima po minuti.

Šta se tačno desilo

OpenAI je proširio svoj Realtime API sa dva specijalizovana modela.

GPT-Realtime-Translate prevodi govor u realnom vremenu sa više od 70 ulaznih jezika na 13 izlaznih jezika. Model je treniran na hiljadama sati snimaka profesionalnih prevodilaca, što znači da čeka dovoljno konteksta prije nego počne da prevodi, umjesto da prevodi riječ po riječ. Rezultat je prevod koji zvuči prirodnije od klasičnog mašinskog prevoda. Cijena: 0,034 dolara po minuti.

GPT-Realtime-Whisper je streaming model za transkripciju govora u tekst sa minimalnim kašnjenjem. Tekst se pojavljuje dok govornik priča, ne nakon što završi. Cijena: 0,017 dolara po minuti, što je oko jednog dolara po satu razgovora.

Oba modela rade kroz API, što znači da nisu dostupni kao gotov proizvod. Developeri ih integrišu u svoje aplikacije, call centre, streaming platforme ili interne alate.

Treći model objavljen istog dana, GPT-Realtime-2, je unaprijeđena verzija postojećeg glasovnog modela sa sposobnošću razmišljanja (reasoning) tokom glasovnog razgovora. Ali za poslovnu primjenu u regionu, prevodilac i transkripcija su znatno relevantniji.

Kontekst ko se takmiči u ovom prostoru

Tržište AI prevođenja govora u realnom vremenu postaje gužva. Google je kroz Gemini pokazao live prevođenje na Google I/O, Meta radi na SeamlessM4T modelu za višejezičnu komunikaciju, a Microsoft je istog dana kada je OpenAI objavio modele najavio integraciju u Azure AI Foundry.

Ono što izdvaja OpenAI-jev pristup je API-first model. Umjesto gotovog proizvoda kao što je Google Translate, OpenAI daje alate developerima da grade vlastita rješenja. To znači veću fleksibilnost ali i veću tehničku barijeru za korištenje.

Cijena je konkurentna. Dva centa po minuti za prevod znači da sat višejezičnog poziva košta oko 2 dolara. Za poređenje, profesionalni simultani prevodilac u regionu košta 30 do 80 eura po satu, zavisno od jezika.

Naša perspektiva šta ovo znači za region

Za firme u jugoistočnoj Evropi, ovi modeli rješavaju konkretan problem. Naš region je poslovni čvor između različitih jezičkih tržišta. Softverska firma iz Banja Luke radi sa klijentima u Njemačkoj, Austriji i Skandinaviji. Turistička agencija u Dubrovniku prima goste koji govore 15 različitih jezika. Call centar u Beogradu opslužuje tržišta od Italije do Turske.

Primjer primjene IT firma koja ima sedmične pozive sa njemačkim klijentom može integrisati Realtime-Translate u Zoom ili Teams poziv. Klijent govori njemački, tim čuje prevod na engleski (ili srpski, ako je podržan kao izlazni jezik) u realnom vremenu. Cijena oko 2 dolara po pozivu od sat vremena. Trenutno plaćaju 0 za to jer se snalaze na engleskom, ali kvalitet komunikacije trpi.

Za call centre u regionu, Realtime-Whisper je direktno primjenjiv. Live transkripcija poziva za monitoring kvaliteta, arhiviranje i analizu, po cijeni od jednog dolara po satu. Do sada su za to koristili skuplje specijalizovane servise ili ručnu transkripciju.

Ograničenje: modeli rade kroz API, pa je potreban developer za integraciju. Ali za firme koje već imaju tehničke kapacitete ili koriste platforme koje će ovo ugraditi, barijera je minimalna.

Zaključak

OpenAI-jevi novi modeli ne donose neku potpuno novu sposobnost. Live prevod i transkripcija postoje godinama. Ali donose kvalitet koji je blizak profesionalnom prevodiocu po cijeni od dva centa po minuti. Za firme u regionu koje svakodnevno komuniciraju na više jezika, to je alat koji se isplati testirati čim bude dostupan kroz platforme koje već koriste.

Ako želiš da saznaš kad ovi alati postanu dostupni kroz popularne platforme i kako ih konkretno primijeniti, prijavi se na AI Balkan newsletter