Исследование+звучащей+речи

В прикладных исследованиях звучащей речи с целью оценки релевантных для распознавания по речи индивидуальных и групповых свойств личности говорящего до настоящего времени основной проблемой все еще остается разработка надежных методик идентификации и диагностики говорящего. Непременным условием для распознавания говорящего по звучащей речи является наличие сравнительных образов или эталонных записей голоса и речи. При этом успех распознавания во многом зависит от степени сопоставимости сравниваемых речевых объектов. прикладным исследованиям звучащей речи, связанным с распознаванием речи и диагностикой голоса, приоритетным становится установление корреляции параметров речевого сигнала и классификационными характеристиками говорящего (его принадлежность к различным возрастным, социальным, профессиональным и диалектным группам) по отраженным в его речевом сигнале языковым признакам. Трудности диагностического и идентификационного исследования речевых особенностей говорящего заключаются в том, что эксперту приходится работать с большим многообразием речевых реализаций, обусловленных экстралингвистическими факторами. До настоящего времени нет, сколько-нибудь приемлемых по надежности и достоверности автоматических систем речевого распознавания на материале русского языка. В условиях реальной криминалистической практики добиться 100% правильной текстонезависимой идентификации говорящего, используя самый современный математический аппарат пока не удается. Используются два подхода к решению проблемы распознавания говорящего по речевому сигналу - текстонезависимый и текстозависимый. Текстонезависимая идентификация основана на алгоритмическом анализе речевого сигнала и математических методах его параметрического описания. Не вдаваясь в детали можно констатировать, что эффективность подобных автоматических систем крайне низка, так как не существует универсальных параметров описывающих речь, устойчивых к шумам и искажениям, к имитации и сознательной маскировки говорящим. Кроме того, вариативность речевого сигнала в пределах языковой системы достаточно высока, зависима от многих взаимосвязанных факторов, не всегда поддающихся формализованному описанию. То есть трудности в создании автоматических речевых систем во многом связаны со сложностью и специфичностью самого исследуемого объекта - звучащей речи. Но задачи распознавания бывают абсолютно разной сложности, от минимальной - сепарации голосов по дифференциальным признакам, верификации говорящих на конечном множестве при наличии известных эталонов, до максимальной - идентификации на открытом множестве в неограниченном пространстве детерминирующих факторов.

Более подробно можно ознакомиться здесь.