11:25 | 02.11.18 | Новости | exclusive 19909

Новая система Ucom распознает и транслирует в текст телефонные разговоры

Компания Ucom разработала систему автоматического распознавания речи на армянском языке (Speech recognition).

Об этой технологии Itel.am побеседовал с руководителем программы Завеном Навояном.

О технологии

«Это технология, которая является системой автоматического распознавания и записи армянской речи. Система распознает армянскую речь и транслирует ее в текстовую форму», - объяснил Завен Навоян, подчеркнув, что система просто записывает текст, не понимая содержания.

По словам руководителя программы, команда Ucom, состоящая из специалистов по разработке естественного языка (natural language processing), машинного обучения, а также программистов и лингвистов, уже 6 лет работает над разработкой программы.

Параллельно с работой собирается база данных записей, которая позволит повысить качество системы.

Об идее

Идея о разработке системы возникла у руководства Ucom 6 лет назад.

Завен Навоян рассказал, что сначала идея была абстрактной, и невозможно было оценить ее сложность. Но, тем не менее, несмотря на большие риски, было решено взяться за проект.

«Важно, какую задачу ставишь перед собой. Если это результат с учетом речи одного человека в бесшумных условиях, то это относительно легкая задача. Гораздо сложнее, если система должна распознавать дикцию любого звонящего, в том числе из шумного места», - отметил Завен Навоян.

О препятствиях

В процессе разработки системы возник ряд трудностей. По словам Завена Навояна, трудность заключается, во-первых, в различиях разговорного и письменного армянского языка.

«В разговорном армянском мы много раз встречаемся с такими предложениями, которые на 90% состоят либо из русских, либо жаргонных слов. Задача системы – работать в таких условиях и обеспечить должное качество», - заверил он.

Следующее препятствие связано с проблемой поиска соответствующих специалистов. Над системой в целом работало 10 человек.

«Сначала мы не могли найти соответствующих специалистов в Армении. По этой причине произошло разделение: часть работ проводилась здесь, другая – в Европе», - отметил Завен Навоян.

Третьим препятствием он назвал шум.

«Выяснилось, что армяне достаточно шумные. Когда отправленные нами записи слушали европейские коллеги, они были очень удивлены, что в армянских телефонных звонках есть столько шума. В течение этих 6 лет мы смогли собрать достаточно большую базу шумов. Благодаря этому система сможет распознать шум, а не принять его за какое-либо слово. Собранная база обеспечила системе стабильность во время звонков из шумных мест», - объяснил руководитель инициативы.

О практическом значении

«Технология готова. На данный момент перед нами стоит задача применить систему внутри Ucom. Однако мы пока не решили, какие проблемы решим таким способом. Сейчас программа используется только для записи телефонных звонков. Причина в том, что она работает только в определенных акустических условиях. Система даст возможность применять ее и в других местах, но об этом пока мы не думаем», - заключил Завен Навоян.

С Завеном Навояном беседовала Нарине Данегян