системы+синтеза+речи

Существует несколько методов синтеза речи: 1. построение слов путем комбинирования фонем и аллофон. Полученная фонемная последовательность, после выбора высоты тона и интонации, превращается в речь. При таком подходе генерируется вполне понятная речь, но слушающему пользователю ясно, что их произносит робот.
 * Синтез речи** (speech synthesis) - процесс преобразования текста в речь. Синтез является одной из форм обработки речи, связанной с задачей чтения программой записанного в ее памяти электронного текста.

2. Имитация речи с использованием модели голосового тракта человека. Здесь глухие и звонкие согласные в речи представляются источниками периодических и шумовых сигналов соответственно. Затем сигналы проходят через каскад фильтров.

Существуют различные методы синтеза речи. Выбор того или иного метода определяется различными ограничениями.

**Ограничения, влияющие на выбор метода синтеза: ** 1. Задача Возможности синтезированной речи зависят от того, в какой области она будет применяться. Когда необходимо произносить ограниченное число фраз (и их произнесение линейно не меняется), необходимый речевой материал просто записывается на пленку. С другой стороны, если задача состоит в стимулировании познавательного процесса при чтении вслух, используется совершенно другой ряд методик.

2. Голосовой аппарат человека Все системы синтеза речи должны производить на выходе какую-то речевую волну, но это не произвольный сигнал. Чтобы получить речевую волну определенного качества, сигнал должен пройти путь от источника в речевом тракте, который возбуждает действие артикуляторных органов, которые действуют как изменяющиеся во времени фильтры. Артикуляторные органы также накладывают ограничения на скорость изменения сигнала. Они также имеют функцию сглаживания: гладкого сцепления отдельных базовых фонетических единиц в сложный речевой поток.

3. Структура языка Ряд возможных звуковых сочетаний определяется природой той или иной языковой структуры. Было обнаружено, что единицы и структуры, используемые лингвистами для описания и объяснения языка, могут также использоваться для характеристики и построения речевой волны. Таким образом, при построении выходной речевой волны используются основные фонологические законы, правила ударения, морфологические и синтаксические структуры, фонотактические ограничения.

4. Технология Возможности успешно моделировать и создавать устройства для синтеза речи в сильной степени зависят от состояния технико-технологической стороны дела. Речевая наука сделала большой шаг вперед благодаря появлению различных технологий, в том числе: рентгенография, кинематография, теория фильтров и спектров, а главным образом - цифровые компьютеры. С приходом интегральных сетевых технологий с постоянно возрастающими возможностями стало возможно построение мощных, компактных, недорогих устройств, действующих в реальном времени. Этот факт, вместе с основательными знаниями алгоритмов синтеза речи, стимулировал дальнейшее развитие систем синтеза речи и переход их в практическую жизнь, где они находят широкое применение.

** Системы синтеза речи ** Наиболее распространенными системами синтеза речи на сего­дня, очевидно, являются системы, поставляемые в комплекте со зву­ковыми платами.. К большинству оригиналь­ных звуковых плат Sound Blaster прилагается система **Creative Tex** **t ****- Assist, **а вместе со звуковыми кар­тами других производителей час­то поставляется программа **Mono­logue** компании **FirsfByte.** **TexAssist **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">представляет собой реализацию формантного синте­затора по правилам и базируется на системе **DECTalk,** разработан­ной корпорацией **Digital Equip­ment** при участии известного аме­риканского фонетиста **Денниса Клатта**. DECTalk до сих пор остается своего рода стандар­том качества для синтеза речи аме­риканского варианта английско­го. Компания **Creative Tech** **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">n ****<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">ologies **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">предлагает разработчикам использовать **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">TextAssist **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">в своих программах**.** <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Программа **Monologue,** пред­назначенная для озвучивания тек­ста, находящегося в буфере обме­на MS Windows, использует сис­тему **ProVoice.** ProVoice - ком­пилятивный синтезатор с исполь­зованием оптимального выбора режима компрессии речи и со­хранения пограничных участков между звуками, разновидность TD-PSOLA. Рассчитан на амери­канский и британский английский, немецкий, французский, латино­американскую разновидность ис­панского и итальянский языки.