OpenAI predstavlja nove modele o1 sa naprednim rezonovanjem
- 13 sep 2024
- Aleksandra
OpenAI je nedavno objavio novu porodicu jezičkih modela pod nazivom o1, koja predstavlja značajan napredak u sposobnostima veštačke inteligencije za rezonovanje i rešavanje složenih problema. Ovi modeli pokazuju impresivne rezultate na testovima iz fizike, hemije, biologije i matematike, nadmašujući prethodne verzije.
Unapređene sposobnosti modela o1 za rezonovanje
Novi modeli o1 kompanije OpenAI donose revoluciju u oblasti veštačke inteligencije svojim poboljšanim sposobnostima rezonovanja. Za razliku od prethodnih verzija, ovi modeli mogu da rešavaju složene probleme na nivou doktorskih studenata u oblastima poput fizike, hemije i biologije. Štaviše, njihove performanse u matematici i programiranju su izuzetne.
Na primer, na kvalifikacionom ispitu za Međunarodnu matematičku olimpijadu (IMO), novi model je uspešno rešio čak 83% zadataka, što je značajno poboljšanje u odnosu na prethodnu verziju GPT-4o koja je tačno rešila samo 13% problema. U oblasti programiranja, o1 modeli su dostigli 89. percentil na takmičenjima Codeforces, demonstrirajući svoje izvanredne sposobnosti u pisanju koda.
Primena modela o1 u nauci i industriji
Poboljšane sposobnosti rezonovanja modela o1 otvaraju nove mogućnosti za primenu u različitim naučnim disciplinama i industrijskim sektorima. Neki od primera uključuju:
- Anotaciju podataka sekvenciranja ćelija u biomedicinskim istraživanjima
- Generisanje složenih matematičkih formula za kvantnu optiku
- Razvoj i izvršavanje višekoračnih radnih tokova u različitim oblastima programiranja
Ova široka primena modela o1 može značajno ubrzati naučna istraživanja i tehnološki razvoj u mnogim sektorima.
Inovativni pristup učenju kroz rezonovanje
Ključ uspeha modela o1 leži u njihovom inovativnom pristupu učenju. OpenAI je razvio algoritam pojačanog učenja velikih razmera koji koristi mehanizam "Lanca misli" (Chain of Thought) za efikasno podučavanje modela produktivnom razmišljanju. Ovaj pristup se razlikuje od tradicionalnog pretreniranja jezičkih modela i pokazuje konzistentno poboljšanje performansi sa povećanjem vremena treniranja i razmišljanja.
Jim Fan, viši istraživački menadžer u kompaniji Nvidia, ističe da ovaj pristup predstavlja paradigmu skaliranja u vreme zaključivanja koja se konačno primenjuje u produkciji. On objašnjava da nije neophodan ogroman model za izvođenje rezonovanja, već je moguće odvojiti proces rezonovanja od znanja, koristeći mali "jezgro za rezonovanje" koje zna kako da poziva alate poput pretraživača i verifikatora koda.
Izazovi i etička pitanja
Uprkos impresivnim sposobnostima, implementacija modela o1 u realnom svetu nosi sa sobom određene izazove i etička pitanja. OpenAI je odlučio da sakrije tokene rezonovanja ili algoritam Lanca misli za ove modele, što je izazvalo zabrinutost među stručnjacima.
Simon Wilson, britanski programer i suosnivač društvenog direktorijuma konferencija Lanyrd, izrazio je nezadovoljstvo ovom odlukom. On smatra da nemogućnost uvida u ključne detalje evaluacije složenih upita predstavlja korak unazad u transparentnosti VI sistema.
Pored toga, iako tokeni rezonovanja nisu vidljivi u API odgovoru, oni se i dalje naplaćuju i računaju kao izlazni tokeni. Ovo znači da će preduzeća morati da povećaju svoje budžete za upite zbog ovih skrivenih tokena rezonovanja.
Dostupnost i ograničenja modela o1
OpenAI je najavio da će modeli o1 biti dostupni korisnicima ChatGPT Plus i Team od četvrtka. Oba modela, o1-preview i o1-mini, mogu se ručno odabrati u izborniku modela. Na početku će postojati nedeljno ograničenje od 30 poruka za o1-preview i 50 za o1-mini.
Za korisnike ChatGPT Enterprise i Edu, pristup obema modelima biće omogućen od sledeće nedelje. Razvojni programeri koji se kvalifikuju za nivo 5 korišćenja API-ja mogu početi sa prototipovima oba modela u API-ju od četvrtka, uz ograničenje od 20 zahteva.
Važno je napomenuti da API za ove modele trenutno ne uključuje pozivanje funkcija, striming, podršku za sistemske poruke i neke druge funkcije. OpenAI planira da u budućnosti omogući pristup modelu o1-mini svim besplatnim korisnicima ChatGPT-a.
U zaključku, modeli o1 predstavljaju značajan korak napred u razvoju veštačke inteligencije sa naprednim sposobnostima rezonovanja. Iako postoje izazovi u vezi sa transparentnošću i troškovima, ovi modeli obećavaju revoluciju u rešavanju složenih problema u nauci, programiranju i drugim oblastima.
Aleksandra
Aleksandra je studentkinja Tehničkog fakulteta u Beogradu, gde se specijalizuje za informacione tehnologije. Osim što je strastvena u pisanju o tehnologiji, uživa u putovanjima i istraživanju novih kulturnih sadržaja. U slobodno vreme se bavi fotografijom i vođenjem bloga o digitalnoj umetnosti.
Veštačka inteligencija
Google angažuje osnivača Character.ai za Gemini AI projekat
- 23 aug 2024
- Petar
Uticaj veštačke inteligencije na potrošnju energije data centara
- 24 sep 2024
- Aleksandra
UN-ovo savetodavno telo za veštačku inteligenciju objavljuje izveštaj
- 19 sep 2024
- Aleksandra