AMD lansira OLMo: Revolucija u svetu otvorenih jezičkih modela

07 nov 2024
Miloš

AMD je nedavno predstavio revolucionarni korak u svetu veštačke inteligencije lansirajući svoju prvu seriju otvorenih jezičkih modela pod nazivom OLMo. Ovaj potez označava značajan pomak u strategiji kompanije i direktno je suprotstavlja vodećim igračima u AI industriji.

Šta je AMD OLMo i kako funkcioniše?

AMD OLMo predstavlja seriju jezičkih modela sa milijardu parametara, obučenih od nule koristeći trilione tokena na klasteru GPU jedinica AMD Instinct MI250. Ovi modeli su dizajnirani da exceliraju u rezonovanju, praćenju instrukcija i konverzaciji, istovremeno prihvatajući filozofiju otvorenog koda koja omogućava programerima pristup podacima, težinama, receptima za obuku i kodu.

Proces obuke OLMo modela odvija se u tri ključne faze:

Preliminarna obuka na podskupu Dolma v1.7 skupa podataka, fokusirajući se na predviđanje sledećeg tokena.
Nadgledano fino podešavanje (supervised fine-tuning) na višestrukim skupovima podataka za unapređenje sposobnosti u oblastima nauke, kodiranja i matematike.
Optimizacija direktnih preferencija (Direct Preference Optimization - DPO) zasnovana na povratnim informacijama korisnika.

Performanse i konkurentska prednost AMD OLMo modela

Prema internim testovima, AMD OLMo modeli su pokazali impresivne rezultate u poređenju sa sličnim otvorenim modelima. Na primer, performanse su povećane za preko 15% na zadacima u GSM8k, što se pripisuje AMD-ovom višefaznom nadgledanom finom podešavanju i DPO optimizaciji.

U testovima razgovora sa više obrtaja, AMD tvrdi da je OLMo pokazao prednost od 3,41% u AlpacaEval 2 Win Rate i 0,97% u MT-Bench u odnosu na najbliže konkurente otvorenog koda. Ovi rezultati ukazuju na snažan potencijal OLMo modela u realnim aplikacijama veštačke inteligencije.

Etička AI i odgovoran pristup AMD-a

AMD-ovi OLMo modeli su takođe pokazali snažne performanse na referentnim testovima odgovorne AI, kao što su ToxiGen (za detekciju toksičnog jezika), crows_pairs (procena pristrasnosti) i TruthfulQA-mc2 (tačnost). Ovi rezultati odražavaju posvećenost AMD-a etičkoj AI, što je ključni fokus kako se integracija AI širi kroz različite industrije.

Pristup otvorenog koda koji AMD zauzima sa OLMo modelima pozicionira ove modele kao pristupačnu i skalabilnu opciju za kompanije koje traže alternative u AI tehnologiji. Modeli se mogu implementirati u data centrima ili na AMD Ryzen AI PC računarima opremljenim neuralnim procesnim jedinicama (NPU), omogućavajući programerima da koriste naprednu AI direktno na ličnim uređajima.

Implikacije za tržište AI i konkurenciju

Ulazak AMD-a u prostor otvorenih jezičkih modela značajno menja dinamiku tržišta AI. Analitičari veruju da jedinstvena strategija otvorenog koda i pristupačnosti AMD-a ima za cilj da privuče preduzeća i programere koji traže fleksibilna, pristupačna AI rešenja bez vlasničkih ograničenja.

Suseel Menon, direktor prakse u Everest Group-i, ističe: "AMD-ov ulazak u prostor otvorenih LLM-ova jača ekosistem, potencijalno snižavajući operativne troškove povezane sa usvajanjem generativne AI." Ovo takođe vrši pritisak na vlasnike LLM-ova da kontinuirano inoviraju i opravdavaju svoje cenovne strukture.

Za velika preduzeća sa dugoročnim brigama o privatnosti podataka, AMD-ov model otvorenog koda nudi privlačnu alternativu dok se kreću kroz integraciju AI. Gradeći koherentnu, full-stack AI ponudu koja obuhvata hardver, LLM-ove i alate ekosistema, AMD se pozicionira sa distinktivnom konkurentskom prednošću među vodećim proizvođačima silicijuma.

Budućnost AI konkurencije i uloga AMD OLMo

Dok AMD ulazi u arenu LLM-ova, suočava se sa etabliranim igračima poput Nvidia-e, Intel-a i Qualcomm-a, koji su stekli tržišnu istaknutost svojim vlasničkim modelima. Međutim, AMD-ova sposobnost da smanji jaz zavisiće od toga koliko dobro njegova inicijativa otvorenog koda i hardverska unapređenja drže korak sa napretkom rivala u performansama, efikasnosti i specijalizovanim AI sposobnostima.

Intel, iako malo zaostaje u vršnoj brzini, koristi svoj Habana Gaudi2 akcelerator za isplative, ali robustne performanse, sa planiranim budućim nadogradnjama za povećanu preciznost. S druge strane, Qualcomm-ov Cloud AI100 naglašava energetsku efikasnost, zadovoljavajući potrebe organizacija koje traže visoke AI performanse bez obimnih energetskih zahteva povezanih sa Nvidia-inim high-end sistemima.

U zaključku, lansiranje AMD OLMo serije otvorenih jezičkih modela predstavlja značajan korak u evoluciji AI industrije. Nudeći uravnoteženu kombinaciju sposobnosti, otvorenosti i versatilnosti, AMD je pozicioniran da napravi značajne prodore na tržištu koje trenutno predvode giganti poput Nvidia-e i Intel-a. Međutim, uspeh ove inicijative zavisiće od kontinuiranog inoviranja i sposobnosti AMD-a da održi korak sa rapidnim napretkom u oblasti veštačke inteligencije.

Tagovi:

Miloš

Miloš je student računarstva na Univerzitetu u Kragujevcu i veliki entuzijasta u vezi sa inovacijama u tehnologiji. Njegovi članci obuhvataju sve od najnovijih gadgeta do tehnoloških trendova. Takođe, Miloš je ljubitelj sporta i često se bavi vođenjem bloga o najnovijim sportskim događajima.

AMD lansira OLMo: Revolucija u svetu otvorenih jezičkih modela

Šta je AMD OLMo i kako funkcioniše?

Performanse i konkurentska prednost AMD OLMo modela

Etička AI i odgovoran pristup AMD-a

Implikacije za tržište AI i konkurenciju

Budućnost AI konkurencije i uloga AMD OLMo

Tagovi:

Miloš

Veštačka inteligencija

Male jezičke modele: Budućnost veštačke inteligencije u preduzećima

Veštačka inteligencija revolucioniše pravnu praksu

Nvidia predstavlja Fugatto: Revolucionarni generativni AI model za zvuk

OpenAI menja pristup bezbednosti veštačke inteligencije

Kategorije

Dnevnjak

Mreže