Anthropic-ը ներկայացրել է Claude Sonnet 5-ը

Anthropic-ը ներկայացրել է Claude Sonnet 5-ը՝ ավելի հզոր գործակալային AI մոդել:

Քանի որ AI հիմնարար մոդելներ մշակող ընկերությունների համար գործակալային (agentic) հնարավորություններն արդեն դարձել են պարտադիր ստանդարտ, Anthropic-ը ներկայացրել է Claude Sonnet 5-ը՝ իր միջին դասի մոդելի ավելի հզոր եւ ինքնավար տարբերակը։

Claude Sonnet 5-ը կարող է կազմել գործողությունների պլաններ, օգտագործել գործիքներ՝ օրինակ բրաուզերներ եւ տերմինալներ, ինչպես նաեւ ինքնուրույն կատարել առաջադրանքներ այն մակարդակով, որը դեռ մի քանի ամիս առաջ պահանջում էր ավելի մեծ եւ թանկարժեք մոդելներ, իր բլոգում նշել է Anthropic-ը։
Այս մոտեցումը համահունչ է OpenAI-ի եւ Google-ի վերջին հայտարարություններին։ OpenAI-ն անցյալ շաբաթ ներկայացրել էր GPT-5.6 Sol-ի նախադիտման տարբերակը, որը նույնպես ընկերության ամենագործակալային մոդելն է՝ հնարավորություն տալով օգտատերերին երկարատեւ ինքնավար առաջադրանքները բաժանել մի քանի ենթագործակալների (subagents) միջեւ։

Google-ի Gemini 3.5 Flash-ը, որը թողարկվել է մայիսին, ներկայացվել է որպես անցում զրույց վարող չատբոթից դեպի գործակալային համակարգ, որը կարող է պլանավորել, ստեղծել եւ կատարել իրական աշխատանք՝ մարդկային նվազագույն միջամտությամբ։

Anthropic-ի տվյալներով՝ Sonnet 5-ն առաջարկում է Opus 4.8-ին մոտ արտադրողականություն, սակայն զգալիորեն ավելի ցածր արժեքով։ Claude Sonnet 5-ը դարձել է լռելյայն մւդել անվճար եւ Pro բաժանորդագրությունների համար եւ հասանելի է բոլոր բաժանորդներին։

Մոդելի մեկնարկային արժեքը մինչեւ օգոստոսի 31-ը կազմում է 2 դոլար՝ մեկ միլիոն մուտքային թոքենի եւ 10 դոլար՝ մեկ միլիոն ելքային թոքենի համար։ Դրանից հետո գինը կբարձրանա համապատասխանաբար մինչեւ 3 եւ 15 դոլար։ Այդպիսով Sonnet 5-ն ավելի մատչելի է, քան Opus 4.8-ը, OpenAI-ի GPT-5.5-ը եւ Google-ի Gemini 3.1 Pro-ն (թեեւ դեռ ավելի թանկ է, քան Gemini 3.5 Flash-ը)։

Anthropic-ի տվյալներով՝ Sonnet 5-ը զգալիորեն գերազանցում է փետրվարին ներկայացված Sonnet 4.6-ին գործակալային հնարավորությունների, տրամաբանության, գործիքների օգտագործման, ծրագրավորման եւ գիտելիքահեն աշխատանքների ոլորտներում։

Ըստ ընկերության ներկայացրած փորձարկումների՝ Sonnet 5-ը նաեւ ավելի լավ է ավարտին հասցնում բարդ առաջադրանքները, որոնք նախորդ տարբերակները հաճախ կիսատ էին թողնում, եւ «ինքն է ստուգում իր արդյունքները՝ նույնիսկ առանց համապատասխան հրահանգ ստանալու»։

Անվտանգության տեսանկյունից Sonnet 5-ը նույնպես բարելավվել է։ Այն ավելի հազվադեպ է դրսեւորում անցանկալի վարքագիծ, ինչպիսիք են չարաշահումների աջակցությունը կամ խաբեությունը, ավելի լավ է մերժում վնասակար հարցումները եւ ավելի արդյունավետ է դիմակայում prompt injection հարձակումներին։ Բացի այդ, այն ավելի քիչ է հալյուցինացնում եւ ավելի հազվադեպ է դրսեւորում օգտատիրոջը հաճոյանալու (sycophancy) վարքագիծ, քան Sonnet 4.6-ը։

Միեւնույն ժամանակ Anthropic-ը նշում է, որ Sonnet 5-ը դեռ չի հասնում Opus 4.8-ի եւ Claude Mythos Preview-ի անվտանգության մակարդակին։ Ընկերության գնահատմամբ՝ Sonnet 5-ը նաեւ զգալիորեն ավելի սահմանափակ կարողություններ ունի վտանգավոր կիբեռանվտանգության առաջադրանքներ իրականացնելու հարցում, քան ներկայիս Opus մոդելները։