Автоматическое+порождение+текста.


 * Автоматическое порождение текстов**

В настоящее время письменный ЕЯ текст широко распространен как средство коммуникации пользователя с компьютерными системами. Большая часть программных приложений, которые выдают тексты на ЕЯ, работает с ЕЯ информацией как со строкой символов. Они манипулируют готовыми предложениями и словосочетаниями как строительными блоками будущего текста. Это - шаблонные технологии. Шаблонные технологии относительно просты и надежны и находят широкое промышленное применение. Главная особенность этих технологий состоит в том, что содержание будущего текста представлено в них в виде фрагментов текста.

Другой вид систем работает с содержанием будущего текста, представленном в виде данных нетекстовой природы (БД, баз знаний, семантических и формальных языков). В этом случае для создания текста системе необходимы знания структуры содержания и знания об устройстве генерируемого текста, а также сложные лингвистические знания, которые позволяют выразить это содержание языковыми средствами.

Это - Лингвистически Мотивированные (ЛМ) технологии. В настоящее время они еще находятся в стадии исследования. ЛМ технологии связаны с изучением жанровых и коммуникативных характеристик текстов, риторических приемов организации содержания текста, языковых средств выражения связности текста (лингвистика текста), формализацией грамматики и лексических описаний.

Мотивации выборов языковых средств выражения знаний в ЛМ технологиях подобны мотивациям движений летящей птицы. Они не могут быть буквально повторены автоматической системой. Поэтому, хотя ЛМ технологии опираются на определенные соответствия неязыковых знаний и языковых средств, они также активно используют и шаблонные технологии для решения конкретных проблем.


 * Методы :**

Самым распространенным (и наиболее просто реализуемым) методом генерации текстов являются различные варианты цепей Маркова. Всё, что требуется для его реализации — программа-генератор и большой объем исходного текста. Научные основы цепей Маркова см. , на практике же это выглядит примерно так: берется начальное слово и помещается в текст-результат, затем оно ищется в исходном тексте, когда находится, то в текст-результат переносится следующее за ним слово, и уже его ищут в исходном тексте...
 * Цепи Маркова**

Опыты показывают, что максимально человекоподобный текст получается из больших объемов текста, равномерного по одержанию. Т.е. если вы возьмете в качестве исходников тексты по биологии и автомобилям, то получите что-нибудь про коробки передач с щупальцами, а если возьмете сказки, то получите вполне внятное «убили меня за копеечку серебряную и наливное яблочко по блюдечку».

Суть метода в том, что имеются большое количество фрагментов предложений типа «таким образом», «с точки зрения высшей математики», «мы не можем игнорировать», «требует оборудования четвертого поколения» и т.п. В классическом примере имеются таблицы A, B, C, D, на которых написаны начала предложений, внутренние части и завершения. Мы выбираем случайный элемент из каждой таблицы и получаем законченное предложение. Возможны варианты изменения порядка таблиц, например A, C, B, D.
 * SIMP-таблицы**

Этот способ не подходит для генерации текстов для поисковых систем, потому что текст состоит из заранее заготовленных словосочетаний и очень быстро перестанет быть уникальным. Но может служить вспомогательным при использовании других методов.

Этот метод лежит в основе алгоритма робота для ведения диалога «Элиза» и ему подобных. Выглядит это примерно так: Человек: На улице идет дождь. Элиза: Почему Вы решили, что на улице идет дождь? И т.п. //Т.е. робот выхватывает основную мысль из фразы человека и генерирует ответ на его основе.//
 * Метод фокуса внимания.**

Наиболее трудоемкий, но наиболее перспективный в плане соблюдения всех норм языка, метод. Требует специально подготовленных словарей с подробным перечислением характеристик слова и его форм, а также изучения порядка слов в предложении. Например, возьмем классическое предложение «Мама мыла раму». Что мы имеем? Существительное женского рода единственного числа в именительном падеже, одушевленное + глагол прошедшего времени + существительное в винительном падеже. Заполняем эту схему случайными словами из нашего словаря — легко создаются не только «Кошка ловила мышку», но и «Мышка варила кошку». Чтобы этих казусов не происходило, требуется очень подробное описание каждого слова, включая, например, тематику. Оживить сухую схему из трех слов можно случайным добавлением наречий и прилагательных, получая что-нибудь наподобие «Красная мама дерзко моет хлебную раму».
 * Метод с использованием словарей.**


 * Программы автоматического порождения текстов**

Название SHRDLU образовано от [|ETAOIN SHRDLU] — расположения алфавитных клавиш на [|линотипах] в соответствии с убыванием частоты появления букв в [|английском языке]. Кроме того, Этаоин Шрдлу — имя разумного линотипа в [|одноимённом фантастическом рассказе] [|Фредерика Брауна]. Пользователь общался с программой SHRDLU с помощью обычных выражений английского языка. По его приказу SHRDLU перемещала простые объекты в упрощенном «мире блоков»: [|кубики], [|конусы], [|шары]и так далее. Уникальной SHRDLU стала благодаря комбинации четырёх простых идей, взаимодействие которых сделало видимость «понимания» программой пользователя гораздо более убедительной. С более подробной информацией о программе Вы можете ознакомиться, перейдя по ссылке: [] > URL:http://ppc-seo.blogspot.com/2007/10/delirium-18.html > URL:http://www.seosin.ru/page/6/. Стоимость — 15$. Есть демо версия. URL:http://monkeywrite.ru/ http://www.dialog-21.ru/Archive/2004/Sokolova.htm http://workinnet.nx0.ru/?p=100 http://freelancers-tools.com/?p=593#more-593 http://www.easybiznes.ru/generating-the-web/ http://ru.wikipedia.org/wiki/SHRDLU Метод обнаружения массово порожденных неестественных текстов:
 * SHRDLU** — ранняя [|программа] [|понимания естественного языка], разработанная [|Терри Виноградом] в [|MIT] в [|1968]—[|1970] годах. Она была написана на языках [|Micro Planner] и [|Лисп] на компьютере [|DEC] [|PDP-6] и использовала графический [|терминал] DEC. Впоследствии в лаборатории [|компьютерной графики] в [|университете штата Юта] была внесена возможность полноценной трёхмерной отрисовки «мира» SHRDLU.
 * Бесплатные программы для автоматической генерации текстов:**
 * 1) ANCHOR – для генерации текстов, простой интерфейс, размер — 300 Кб. Более подробно на сайте создателя программы: URL:http://www.yurok.co.ua/4.html
 * 2) Delirium 1.8 Эта программа генерирует смешные тексты на основе существующих. Она использует алгоритм марковских цепочек, позволяющий создавать довольно длинные "осмысленные" фразы. Обычно в генерированном программой тексте попадается несколько весьма смешных фраз, например, "У них на лицах было то выражение, которое так необходимо колесам, чтобы они катились"(Лев Толстой, из ненаписанного) или "Здравствуйте, это Илья. Я сплю и не очень".
 * 1) Generating the Web – наиболее мощная программа для генерации методом переборов, перестановок. Перестановки есть простые, с одинаковыми и разными разделителями, с использованием различных переменных, есть множество других настроек.URL:http://www.generating-the-web.com/generating-the-web.shtml
 * 2) SeoGenerator (SEO Anchor Generator) представляет собой удобные и быстрые инструменты генерации текстов, анкоров, названий. В первую очередь SeoGenerator ориентирован на SEO оптимизаторов, т.к. позволяет сэкономить много времени в рутинных операциях, которые являются неотъемлемой частью работы любого оптимизатора.URL:http://www.seogenerator.ru/
 * Платные программы для автоматической генерации текстов:**
 * 1) «Синонимайзер» – большая база русских синонимов — 638 000 слов и словосочетаний, украинские и другие синонимы на латиннице. Отбор избранных синонимов в отдельную базу, есть выбор случайных синонимов, подготовка текста для размножения (эта функция будет полезна тем кто продвигает сайт статьями). Продукт имеет постоянную поддержку. Есть демо версия. Стоимость — 25$. URL:http://www.templatebest.ru/prog01.php
 * 2) SyMonym — программа для уникализации текстов, в ручном режиме доступна база из 68272 просклоненных словоформ.
 * 1) MonkeyWrite Этот генератор текстов отличается от аналогичных программ более мощным функционалом, дополнительными возможностями, более понятным интерфейсом работы над проектом, где каждое предложение текста представляется отдельной строкой. Генератор позволяет намного быстрее размножать тексты, причем не просто заменяя синонимами слова и выражения, но и легко перестраивая и перефразируя предложения. Имеется возможность автоматически в результирующих статьях менять местами абзацы или их группы, автоматизированно расставлять ссылки по заранее созданному анкор-листу.
 * Источники:**
 * Дополнительный материал:**Система автоматического порождения англоязычных деловых электронных писем :

Порождение текста с помощью компьютера: []