13:24 | 29.01.25 | Նորություններ | 658
Չինական Alibaba ընկերության ամպային ստորաբաժանումը հայտարարել է նորացված, լայնածավալ լեզվական մոդելի՝ Qwen2.5-Max-ի թողարկման մասին:
AI մոդելը հիմնված է Mixture-of-Experts (MoE) ճարտարապետության վրա եւ վերապատրաստվել է ավելի քան 20 տրիլիոն նշանի վրա: Մշակողները շեշտում են, որ գործիքը ցույց է տվել «զգալի առաջընթաց» եւ արդեն հասանելի է օգտագործման համար:
Մոդելի նոր տարբերակն առանձնանում է բարելավված կատարողականությամբ եւ ճշգրտությամբ, ինչպես նաեւ ավելի լավ է կարողանում լուծել այնպիսի առաջադրանքներ, որոնք պահանջում են համատեքստի խորը ընկալում, ինչպիսիք են տեքստի վերլուծությունը, թարգմանությունը եւ բովանդակության ստեղծումը:
Qwen2.5-Max-ը փորձարկվել է մի շարք հիմնական կատեգորիաներում, ներառյալ MMLU-Pro, LiveCodeBench, LiveBench եւ Arena-Hard ցուցանիշերը: Մոդելը գերազանցություն է ցույց տվել DeepSeek V3-ի նկատմամբ՝ Arena-Hard-ը, LiveBench-ը եւ LiveCodeBench-ը, ինչպես նաեւ ցույց է տվել մրցակցային արդյունքներ MMLU-Pro-ում: Համեմատելով այլ առաջատար մոդելներ GPT-4o-ի եւ Claude-3.5-Sonnet-ի հետ՝ Qwen2.5-Max-ը նույնպես հաստատել է իր առաջատար դիրքը: