AMD lansira OLMo: Revolucija u svetu otvorenih jezičkih modela
- 07 nov 2024
- Miloš
AMD je nedavno predstavio revolucionarni korak u svetu veštačke inteligencije lansirajući svoju prvu seriju otvorenih jezičkih modela pod nazivom OLMo. Ovaj potez označava značajan pomak u strategiji kompanije i direktno je suprotstavlja vodećim igračima u AI industriji.
Šta je AMD OLMo i kako funkcioniše?
AMD OLMo predstavlja seriju jezičkih modela sa milijardu parametara, obučenih od nule koristeći trilione tokena na klasteru GPU jedinica AMD Instinct MI250. Ovi modeli su dizajnirani da exceliraju u rezonovanju, praćenju instrukcija i konverzaciji, istovremeno prihvatajući filozofiju otvorenog koda koja omogućava programerima pristup podacima, težinama, receptima za obuku i kodu.
Proces obuke OLMo modela odvija se u tri ključne faze:
- Preliminarna obuka na podskupu Dolma v1.7 skupa podataka, fokusirajući se na predviđanje sledećeg tokena.
- Nadgledano fino podešavanje (supervised fine-tuning) na višestrukim skupovima podataka za unapređenje sposobnosti u oblastima nauke, kodiranja i matematike.
- Optimizacija direktnih preferencija (Direct Preference Optimization - DPO) zasnovana na povratnim informacijama korisnika.
Performanse i konkurentska prednost AMD OLMo modela
Prema internim testovima, AMD OLMo modeli su pokazali impresivne rezultate u poređenju sa sličnim otvorenim modelima. Na primer, performanse su povećane za preko 15% na zadacima u GSM8k, što se pripisuje AMD-ovom višefaznom nadgledanom finom podešavanju i DPO optimizaciji.
U testovima razgovora sa više obrtaja, AMD tvrdi da je OLMo pokazao prednost od 3,41% u AlpacaEval 2 Win Rate i 0,97% u MT-Bench u odnosu na najbliže konkurente otvorenog koda. Ovi rezultati ukazuju na snažan potencijal OLMo modela u realnim aplikacijama veštačke inteligencije.
Etička AI i odgovoran pristup AMD-a
AMD-ovi OLMo modeli su takođe pokazali snažne performanse na referentnim testovima odgovorne AI, kao što su ToxiGen (za detekciju toksičnog jezika), crows_pairs (procena pristrasnosti) i TruthfulQA-mc2 (tačnost). Ovi rezultati odražavaju posvećenost AMD-a etičkoj AI, što je ključni fokus kako se integracija AI širi kroz različite industrije.
Pristup otvorenog koda koji AMD zauzima sa OLMo modelima pozicionira ove modele kao pristupačnu i skalabilnu opciju za kompanije koje traže alternative u AI tehnologiji. Modeli se mogu implementirati u data centrima ili na AMD Ryzen AI PC računarima opremljenim neuralnim procesnim jedinicama (NPU), omogućavajući programerima da koriste naprednu AI direktno na ličnim uređajima.
Implikacije za tržište AI i konkurenciju
Ulazak AMD-a u prostor otvorenih jezičkih modela značajno menja dinamiku tržišta AI. Analitičari veruju da jedinstvena strategija otvorenog koda i pristupačnosti AMD-a ima za cilj da privuče preduzeća i programere koji traže fleksibilna, pristupačna AI rešenja bez vlasničkih ograničenja.
Suseel Menon, direktor prakse u Everest Group-i, ističe: "AMD-ov ulazak u prostor otvorenih LLM-ova jača ekosistem, potencijalno snižavajući operativne troškove povezane sa usvajanjem generativne AI." Ovo takođe vrši pritisak na vlasnike LLM-ova da kontinuirano inoviraju i opravdavaju svoje cenovne strukture.
Za velika preduzeća sa dugoročnim brigama o privatnosti podataka, AMD-ov model otvorenog koda nudi privlačnu alternativu dok se kreću kroz integraciju AI. Gradeći koherentnu, full-stack AI ponudu koja obuhvata hardver, LLM-ove i alate ekosistema, AMD se pozicionira sa distinktivnom konkurentskom prednošću među vodećim proizvođačima silicijuma.
Budućnost AI konkurencije i uloga AMD OLMo
Dok AMD ulazi u arenu LLM-ova, suočava se sa etabliranim igračima poput Nvidia-e, Intel-a i Qualcomm-a, koji su stekli tržišnu istaknutost svojim vlasničkim modelima. Međutim, AMD-ova sposobnost da smanji jaz zavisiće od toga koliko dobro njegova inicijativa otvorenog koda i hardverska unapređenja drže korak sa napretkom rivala u performansama, efikasnosti i specijalizovanim AI sposobnostima.
Intel, iako malo zaostaje u vršnoj brzini, koristi svoj Habana Gaudi2 akcelerator za isplative, ali robustne performanse, sa planiranim budućim nadogradnjama za povećanu preciznost. S druge strane, Qualcomm-ov Cloud AI100 naglašava energetsku efikasnost, zadovoljavajući potrebe organizacija koje traže visoke AI performanse bez obimnih energetskih zahteva povezanih sa Nvidia-inim high-end sistemima.
U zaključku, lansiranje AMD OLMo serije otvorenih jezičkih modela predstavlja značajan korak u evoluciji AI industrije. Nudeći uravnoteženu kombinaciju sposobnosti, otvorenosti i versatilnosti, AMD je pozicioniran da napravi značajne prodore na tržištu koje trenutno predvode giganti poput Nvidia-e i Intel-a. Međutim, uspeh ove inicijative zavisiće od kontinuiranog inoviranja i sposobnosti AMD-a da održi korak sa rapidnim napretkom u oblasti veštačke inteligencije.
Miloš
Miloš je student računarstva na Univerzitetu u Kragujevcu i veliki entuzijasta u vezi sa inovacijama u tehnologiji. Njegovi članci obuhvataju sve od najnovijih gadgeta do tehnoloških trendova. Takođe, Miloš je ljubitelj sporta i često se bavi vođenjem bloga o najnovijim sportskim događajima.
Veštačka inteligencija
Chat GPT-4 nadmašuje lekare u dijagnostici bolesti
- 19 nov 2024
- Miloš
Google-ova revolucionarna nadogradnja: Gemini Gems
- 29 aug 2024
- Miloš
Mistral predstavlja Pixtral 12B: Novi multimodalni AI model
- 12 sep 2024
- Aleksandra