Ucom-ի նոր համակարգը լսում եւ տեքստի է վերածում հեռախոսազրույցը

#Speech recognition #Ucom

Ucom ընկերությունը արհեստական բանականության հիմքով հայերեն լեզվով խոսքի ավտոմատ ճանաչման (Speech recognition) համակարգ է մշակել:

Itel.am-ը տեխնոլոգիայի մասին զրուցել է Ucom-ի հայերեն խոսքի ճանաչման համակարգի ծրագրի ղեկավար Զավեն Նավոյանի հետ:

Տեխնոլոգիայի մասին

«Սա տեխնոլոգիա է, որն իրենից ներկայացնում է հայերեն խոսքի ավտոմատ ճանաչման եւ սղագրման համակարգ: Համակարգը լսում եւ տեքստային տարբերակով վերարտադրում է հեռախոսով արտաբերվող հայերեն խոսքը»,- բացատրել է Զավեն Նավոյանը՝ ընդգծելով, որ համակարգը չի հասկանում բովանդակությունը, այլ ուղղակի տեքստն է սղագրում:

Ծրագրի ղեկավարի խոսքով՝ Ucom-ի թիմն արդեն 6 տարի է՝ աշխատում է համակարգի մշակման վրա: Աշխատանքներում ներգրավված են եղել բնական լեզվի մշակման (natural language processing) եւ մեքենայական ուսուցման մասնագետներ, ծրագրավորողներ, լեզվաբաններ:

Աշխատելուն զուգահեռ, նոր ձայնագրություններ են կուտակվելու, որը կօգնի համակարգի որակն էլ ավելի բարձրացնել:

Գաղափարի մասին

Համակարգի ստեղծման գաղափարը Ucom-ի ղեկավարության մոտ ծագել է 6 տարի առաջ:

Զավեն Նավոյանը պատմում է, որ ամենասկզբում գաղափարը վերացական էր եւ անհնար էր գնահատել դրա բարդությունը: Ու չնայած մեծ ռիսկերին, այնուամենայնիվ, որոշել են զբաղվել նախագծով:

«Այստեղ էական է, թե ինչ խնդիր ես դնում քո առջեւ: Եթե նպատակն անաղմուկ պայմաններում ինչ-որ որակ ստանալն է, երբ խոսում է մեկ հոգի, դա համեմատաբար ավելի հեշտ խնդիր է: Սակայն, եթե համակարգը պետք է հասկանա ցանկացած զանգ կատարողի՝ ցանկացած դիկցիայով, ցանկացած, այդ թվում, աղմկոտ վայրից, դա շատ ավելի բարդ խնդիր է»,- նշել է Զավեն Նավոյանը:

Բարդությունների մասին

Համակարգի մշակման փուլում առաջացել են մի շարք դժվարություններ: Դրանցից մեկը, ըստ Զավեն Նավոյանի, խոսակցական եւ գրական հայերեն լեզուների տարբեր լինելու պատճառով է:

«Խոսակցական հայերենում շատ ենք հանդիպում այնպիսի նախադասությունների, որոնք 90 տոկոսով կամ ռուսերեն կամ ժարգոնային բառերից են կազմված: Համակարգի խնդիրն է կարողանալ այդ պայմաններում աշխատել եւ պատշաճ որակ ապահովել»,- բացատրել է նա:

Մյուս բարդությունը կապված է համապատասխան մասնագետներ գտնելու խնդրի հետ: Համակարգի վրա, ընդհանուր առմամբ, 10 հոգի է աշխատել:

«Երբ նոր էինք սկսում, համապատասխան մասնագետներ Հայաստանում չկարողացանք գտնել: Այդ պատճառով աշխատանքի բաժանում տեղի ունեցավ: Գործընթացի մի մասն արվեց այստեղ, մյուս մասը՝ Եվրոպայում»,- նշել է Զավեն Նավոյանը:

Որպես երրորդ խոչընդոտ՝ նա առանձնացնում է աղմուկը:

«Պարզվում է, որ հայերը բավական աղմկոտ են, եւ երբ մեր ուղարկած ձայնագրությունները եվրոպացի գործընկերներն էին լսում, շատ էին զարմանում, որ հայաստանյան հեռախոսազանգերի մեջ այդքան աղմուկ կա: Այս 6 տարում կարողացանք հավաքել եւ անոտացնել աղմուկների բավական մեծ բազա: Նպատակն է, որ համակարգը կարողանա հասկանալ եւ տարբերակել աղմուկը, այլ ոչ թե մոտարկել ինչ-որ բառի: Հավաքված բազան օգնեց, որ համակարգը սկսի իրեն բավական կայուն պահել՝ աղմկոտ միջավայրում կատարվող զանգերի ժամանակ»,- բացատրել է ծրագրի ղեկավարը:

Կիրառական նշանակության մասին

«Տեխնոլոգիան պատրաստ է: Այս պահին խնդիր ենք դրել նախ համակարգը կիրառել Ucom-ի ներսում, սակայն դեռ չենք հստակեցրել, թե դրա միջոցով ինչ խնդիրներ ենք լուծելու: Այս պահին այն կարող է աշխատել միայն հեռախոսազանգեր սղագրելու նպատակով: Պատճառն այն է, որ այն աշխատում է միայն որոշակի ակուստիկ պայմաններում: Համակարգը հնարավորություն է տալիս այն կիրառել նաեւ այլ վայրերում, սակայն այդ մասին դեռ չենք մտածում»,- ամփոփել է Զավեն Նավոյանը:

Զավեն Նավոյանի հետ զրուցել է Նարինե Դանեղյանը