Вы находитесь здесь:  
Russian (CIS)English (United Kingdom)
Технологии

Вход / Регистрация






Техподдержка

Служба технической поддержки работает с 10.00 до 19.00 с понедельника по пятницу.
Суббота и воскресенье - выходные дни.
e-mail: support@istrasoft.ru

Способы оплаты

visamcwebmoney logologo-yandex-moneyqiwialfarspromsvsvyaznoyevrosetmtsbeeline logorostelecom logo

Речевые технологии... и не только они

Фирма «ИстраСофт» разработала новые алгоритмы и программное обеспечение для анализа речевой информации, при этом эффективно интегрируя распознавание речи, компрессию, синтез и идентификацию голоса. В отличие от других фирм, работающих в области речевых технологий, технология «ИстраСофт» позволяет выделить и измерить в речевом сигнале элементарные звуки (фонемы), независимо от говорящего, что дает хорошие результаты даже при высоком уровне фонового шума.

Наиболее известные компании в области речевых технологий: IBM, Philips, Acapela-grup, Nuance, SpeechWorks и ART.

Технология распознавания речи у всех этих компании основана на преобразовании в частотную область частей речевого сигнала, выделенных тем или иным образом, и сравнению этих частей с накопленной ранее звуковой базой. Этот подход, однако, имеет несколько недостатков:

  • требует, чтобы пользователь создал его собственный "типовой архив", наговорив чтением несколько страниц текста;
  • распознавание ограничено и как правило возможно только для тех голосов, из которых был создан архив;
  • система очень чувствительна к внешним условиям и аппаратуре, внешние шумы, тип микрофона и эмоциональное состояние говорящего существенно снижают процент распознавания.

Несмотря на вложенные в эти технологии большие капиталы, результаты остаются далекими от совершенства, поскольку в полученной таким образом спектральной информации находится огромное количество звуковой (вокальной) информации, не относящейся к распознаваемой.

Подход фирмы «ИстраСофт», напротив, основан на выделении и измерении в речевом сигнале элементарных, не зависящих от индивидуальности говорящего, звуковых объектов, формирующих речь. Речевой сигнал анализируется, и в нем измеряются и классифицируются только те части (характеристики) речевого сигнала, которые создают ощущение элементарного звука. Под элементарным звуком понимается только та выделенная и очищенная от всех других частей, часть речевого сигнала, которая создает нам в речи, ощущение определенного звука.

Такой подход дает возможность разработать систему распознавания не чувствительную к шумам и сделать ее голосонезависимой, разработать алгоритмы и технологию визуализации фонем в речевом сигнале, используемую в наших программах обучения языкам серии «Профессор Хиггинс ®» и не только в них.

Эти программы при обучении языку позволяют обучаемым сравнивать свое произношение не только на слух, но и визуально, с эталоном произношения по специально разработанной системе графического отображения речи на экране монитора. Программы используют технологию распознавания речи, разработанную «ИстраСофт» для оценки правильности произношения звуков и слов.

Для удобства разработки языковых обучающих программ была создана специальная программная оболочка, которая позволяет удобно и быстро разрабатывать речевые обучающие программы для различных языков, использующая технологии XML и для интернет-версий .net технологию. С ее помощью разработаны многие обучающие программы в рамках создания ЦОР (цифровых образовательных ресурсов) для школ России.

Программы серии «Профессор Хиггинс» получили признание, как в России, так и за рубежом. Программа «Профессор Хиггинс. Английский без акцента!» принята Министерством образования для поставки и поставлена во все школы России в рамкам президентской программы информатизации школ. Тиражируется дистрибьюторами и продается в соответствующей локализации в европейских странах, таких как Германия, Испания, Италия и Англия.

Примеры использования технологии вы можете скачать и посмотреть в этом разделе.

1-participant-ru-84x60 logo_color_hor.jpg cert8
Мы принимаем к оплате карты:
visa mastercard