Alibaba-ն թողարկել է նոր AI մոդել, որը գերազանցում է GPT-4o-ին եւ DeepSeek V3-ին

Չինական Alibaba ընկերության ամպային ստորաբաժանումը հայտարարել է նորացված, լայնածավալ լեզվական մոդելի՝ Qwen2.5-Max-ի թողարկման մասին:

AI մոդելը հիմնված է Mixture-of-Experts (MoE) ճարտարապետության վրա եւ վերապատրաստվել է ավելի քան 20 տրիլիոն նշանի վրա: Մշակողները շեշտում են, որ գործիքը ցույց է տվել «զգալի առաջընթաց» եւ արդեն հասանելի է օգտագործման համար:

Մոդելի նոր տարբերակն առանձնանում է բարելավված կատարողականությամբ եւ ճշգրտությամբ, ինչպես նաեւ ավելի լավ է կարողանում լուծել այնպիսի առաջադրանքներ, որոնք պահանջում են համատեքստի խորը ընկալում, ինչպիսիք են տեքստի վերլուծությունը, թարգմանությունը եւ բովանդակության ստեղծումը:

Qwen2.5-Max-ը փորձարկվել է մի շարք հիմնական կատեգորիաներում, ներառյալ MMLU-Pro, LiveCodeBench, LiveBench եւ Arena-Hard ցուցանիշերը: Մոդելը գերազանցություն է ցույց տվել DeepSeek V3-ի նկատմամբ՝ Arena-Hard-ը, LiveBench-ը եւ LiveCodeBench-ը, ինչպես նաեւ ցույց է տվել մրցակցային արդյունքներ MMLU-Pro-ում: Համեմատելով այլ առաջատար մոդելներ GPT-4o-ի եւ Claude-3.5-Sonnet-ի հետ՝ Qwen2.5-Max-ը նույնպես հաստատել է իր առաջատար դիրքը:

Alibaba Cloud-ը նախատեսում է ինտեգրել Qwen2.5-Max-ն իր ամպային ծառայությունների մեջ՝ թույլ տալով հաճախորդներին օգտագործել գործիքը, որպեսզի լուծի խնդիրների լայն շրջանակ, ներառյալ տվյալների մշակման ավտոմատացումը, չատբոտերի միջոցով հաճախորդների փոխհարաբերությունների բարելավումը եւ բիզնես գործընթացների օպտիմալացումը:

AI-ի մոդելն արդեն հասանելի է Qwen Chat ծառայության միջոցով, որտեղ օգտատերերը կարող են շփվել Qwen2.5-Max-ի հետ, փորձարկել դրա հնարավորությունները եւ փորձարկել տարբեր գործառույթներ։ API-ը նույնպես բաց է մշակողների համար: Մուտք գործելու համար անհրաժեշտ է գրանցվել Alibaba Cloud-ում, ակտիվացնել Model Studio ծառայությունը եւ ստեղծել API բանալի: