Kada AI počne rješavati matematiku koju niko nije objavio
Ako AI može riješiti istraživačke matematičke probleme koje nikada nije vidio, granica između alata i ko-autora postaje nejasna.
Postoji razlika između rješavanja zadataka sa olimpijade i ulaska u teritoriju gdje ni profesori nemaju gotove odgovore. Prvo je impresivno. Drugo je uznemirujuće.
Godinama je granica bila jasna. Vještačka inteligencija može da položi ispit, može da prođe test, može da imitira stil rada. Ali kada se dođe do neobjavljenih, istraživačkih problema tu počinje “prava” matematika, ili smo barem tako mislili.
Sada se ta linija ponovo pomjera.
Šta se zapravo desilo
Jedanaest vrhunskih matematičara, uključujući i jednog dobitnika Fields medalje, kreirali su “First Proof” set od 10 potpuno novih, neobjavljenih problema iz različitih oblasti od algebraičke topologije do simplektičke geometrije. Problemi su uzeti direktno iz njihovog istraživačkog rada. Nisu postojali na internetu. Nisu mogli biti dio trening podataka.
Model iz OpenAI, interni i još uvijek neobjavljen, dobio je sedam dana da ih riješi.
Prema riječima glavnog naučnika kompanije Jakuba Pachockog, model je vjerovatno riješio najmanje 5 od 10 problema. Prvobitno je tvrdnja bila 6, ali je jedan odgovor povučen nakon dodatne provjere. Za poređenje, javno dostupni modeli poput ChatGPT-a i Google-ovog Gemini sistema uspjeli su riješiti dva.
Postojala je ljudska supervizija, ali ograničena. Modelu nisu davane strategije dokazivanja. Eksperti su pregledali izlaze i tražili dodatna pojašnjenja. Sve se desilo u roku od jedne sedmice, što je i sam Pachocki opisao kao “haotični sprint” sa metodologijom koja “ostavlja mnogo toga da se poželi”.
Istog dana, 13. februara, kompanija je objavila i fizikalni preprint u kojem model GPT-5.2 predlaže formulu za interakcije gluona problem za koji se decenijama pretpostavljalo da je praktično nerješiv. Istraživači sa Harvard University i University of Cambridge verifikovali su rezultate, a profesor sa University of California Santa Barbara opisao ih je kao rad na nivou naučnog časopisa.
Zašto je ovo uopšte bitno
Do sada smo se navikli na obrazac. Prvo AI pobijedi u šahu. Onda u igri Go-u. Onda na standardizovanim testovima. Svaki put skeptici kažu: “Dobro, ali to je zatvoren sistem. To nije prava kreativnost.”
Matematika na istraživačkom nivou je bila posljednje utočište tog argumenta. Ako model može da generiše validan dokaz za problem koji nikada nije vidio i to u oblasti gdje su i eksperti trebali mjesecima onda se ne radi više o pukom prepoznavanju obrazaca.
Radi se o sistematskom istraživanju prostora mogućih rješenja.
I možda je to suština. Ovi modeli ne “razumiju” matematiku u ljudskom smislu. Ali pretražuju apstraktne prostore hipoteza brzinom i skalom koja ljudima nije dostupna. Ako se pokaže da mogu konzistentno generisati nove, validne rezultate u fizici i matematici, onda prelazimo iz faze asistenta u fazu ko-autora.
Šta se previđa u javnoj priči
Postoji nekoliko stvari koje se lako izgube u uzbuđenju.
Prvo, sve tvrdnje dolaze iz same kompanije. Iako su eksterni stručnjaci provjeravali rješenja, cjelokupni proces nije bio javno reproducibilan. Model je interni. Kod i parametri nisu dostupni. To znači da zajednica mora vjerovati u interpretaciju rezultata.
Drugo, pet od deset nije deset od deset. U istraživačkom kontekstu, djelimičan uspjeh je impresivan, ali nije potpuna autonomija. Još uvijek postoji ljudski filter, ljudska validacija i ljudska procjena šta je zapravo rješenje.
Treće, metodologija je opisana kao improvizovana. Ako je ovo postignuto u “haotičnom sprintu”, pitanje nije samo koliko je model dobar – već koliko je sistem oko njega organizovan.
U nauci, proces je jednako važan kao i rezultat.
Šira slika
Godinama je postojala udobna distanca između “AI može pomoći” i “AI može raditi nauku”. Ta distanca se sada sužava.
Kada model generiše formulu za interakcije gluona koju istraživači decenijama nisu uspjeli izvesti, to nije samo tehnički uspjeh. To je promjena u odnosu moći između alata i korisnika.
Akademija je navikla da bude izvor znanja, a industrija njegov primjenjivač. Sada privatne kompanije razvijaju modele koji potencijalno guraju granice teorijske fizike i čiste matematike. To znači da infrastruktura postaje važnija od pojedinačne genijalnosti.
Ako sljedeća runda “First Proof” problema 14. marta potvrdi trend, pitanje više neće biti da li AI može raditi nauku. Pitanje će biti ko kontroliše sistem koji je radi.
Možda najveća promjena nije u tome što mašina rješava teške zadatke, već u tome što smo se, gotovo neprimjetno, navikli na tu ideju.