Фирма «ИстраСофт» разработала новые алгоритмы и программное обеспечение для анализа речевой информации, при этом эффективно интегрируя распознавание речи, компрессию, синтез и идентификацию голоса. В отличие от других фирм, работающих в области речевых технологий, технология «ИстраСофт» позволяет выделить и измерить в речевом сигнале элементарные звуки (фонемы), независимо от говорящего, что дает хорошие результаты даже при высоком уровне фонового шума.
Наиболее известные компании в области речевых технологий: IBM, Philips, Acapela-grup, Nuance, SpeechWorks и ART.
Технология распознавания речи у всех этих компании основана на преобразовании в частотную область частей речевого сигнала, выделенных тем или иным образом, и сравнению этих частей с накопленной ранее звуковой базой. Этот подход, однако, имеет несколько недостатков:
Несмотря на вложенные в эти технологии большие капиталы, результаты остаются далекими от совершенства, поскольку в полученной таким образом спектральной информации находится огромное количество звуковой (вокальной) информации, не относящейся к распознаваемой.
Подход фирмы «ИстраСофт», напротив, основан на выделении и измерении в речевом сигнале элементарных, не зависящих от индивидуальности говорящего, звуковых объектов, формирующих речь. Речевой сигнал анализируется, и в нем измеряются и классифицируются только те части (характеристики) речевого сигнала, которые создают ощущение элементарного звука. Под элементарным звуком понимается только та выделенная и очищенная от всех других частей, часть речевого сигнала, которая создает нам в речи, ощущение определенного звука.
Такой подход дает возможность разработать систему распознавания не чувствительную к шумам и сделать ее голосонезависимой, разработать алгоритмы и технологию визуализации фонем в речевом сигнале, используемую в наших программах обучения языкам серии «Профессор Хиггинс ®» и не только в них.
Эти программы при обучении языку позволяют обучаемым сравнивать свое произношение не только на слух, но и визуально, с эталоном произношения по специально разработанной системе графического отображения речи на экране монитора. Программы используют технологию распознавания речи, разработанную «ИстраСофт» для оценки правильности произношения звуков и слов.
Для удобства разработки языковых обучающих программ была создана специальная программная оболочка, которая позволяет удобно и быстро разрабатывать речевые обучающие программы для различных языков, использующая технологии XML и для интернет-версий .net технологию. С ее помощью разработаны многие обучающие программы в рамках создания ЦОР (цифровых образовательных ресурсов) для школ России.
Программы серии «Профессор Хиггинс» получили признание, как в России, так и за рубежом. Программа «Профессор Хиггинс. Английский без акцента!» принята Министерством образования для поставки и поставлена во все школы России в рамкам президентской программы информатизации школ. Тиражируется дистрибьюторами и продается в соответствующей локализации в европейских странах, таких как Германия, Испания, Италия и Англия.
Примеры использования технологии вы можете скачать и посмотреть в этом разделе.