TextSTAT

TextSTAT читает MS Word и OpenOffice файлы. Нет никакой нужды в преобразовании, просто добавьте файлы в корпус программы.
 * TextSTAT-** это простая программа для анализирования текстов, читающая текстовые файлы и файлы расширения HTML(непосредственно из Интернета). Она выдает лист частоты встречаемости слов и конкордансы этих файлов. Данная версия включает в себя вэб-паука, который читает так много страниц, сколько вы захотите с какого-либо выбранного сайта и переносит их в программу. А новинка «читатель новостей» так же находит самостоятельно информацию и помещает их в окно программы TextSTAT.

В программе можно использовать регулярные выражения, обеспечивающие вас возможностями мощного поиска. Программа многоязыковая. TextSTAT может справиться с множеством различных языков и кодировок файлов.

Ниже приведены скрин-шоты с использованием функций конкорданца и частоты встречаемости слов. Конкорданс (немецкий язык)

Частота встречаемости слов (английский язык) Файлы можно сохранять и использовать в дальнейшем, дорабатывая их. Инструкция по работе с программой на английском языке (с) Gena Bennett Подробнее: http://neon.niederlandistik.fu-berlin.de/static/textstat/TextSTAT-Doku-EN.html

Matthias Hüning http://neon.niederlandistik.fu-berlin.de/en/textstat/

Работает на платформе Windows (была протестирована)