Словники,+конкордансы+и+др

**Создание словников, конкордансов, частотных словарей**
1. **Создание словника.**При подготовке словника энциклопедии он представляет собой оглавление издания, отражающее его структуру и профиль. При составлении словника производится отбор терминов и устанавливается соотношение объёмов разделов и отдельных статей, выделяется цикл статей, разрабатывается система ссылок. С работой над словником тесно связано планирование помещения библиографии, иллюстраций, карт и другого дополнительного материала. При ограниченном объёме издания словник используется для планирования заданного объёма. Издание энциклопедии обычно начинается с составления //тематических// словников по разным отраслям знаний, имеющих рубрикацию от общих понятий до частных терминов. На основе сводного тематического словника составляется общий //алфавитный// словник всего издания. Для включения в энциклопедию новых терминов в процессе работы при составлении словника закладывается резерв количества статей. Созданию подобных словарей-словников посвящено много сайтов, которые имеют подробное описание процесса создания. Некоторые из них:
 * Создание словника для использования в приложении для мобильных телефонов: []
 * Создание словаря-словника к фильмам на иностранном языке: []

2. **Создание конкорданса.** Даже с использованием компьютера создание конкорданса является трудоёмкой работой, так как конкордансы часто включают комментарии, определения слов или интертекстуальные ссылки – материалы, которые пока невозможно получить автоматически. Существуют специальные программы составления конкордансов по некоторому корпусу текстов, так называемые конкордансеры. Они позволяют получать частоту той или иной языковой единицы по произвольному корпусу текстов, список контекстов, в которых данная единица встретилась. Многие из них позволяют также сортировать контексты по ключевому слову (в исходной форме) или по словоформе, по ближайшему контексту. Список программ-конкордансеров: Примеры конкордансов:
 * Concordance;
 * MicroConcord;
 * MonoCorc;
 * TACT (Text Analysis Computing Tools);
 * TACTWeb;
 * SARA;
 * Kontext.
 * Словарь-конкорданс публицистики Ф.М. Достоевского http://dostoevskii.karelia.ru,
 * Nave’s Topical Bible @http://www.biblestudytools.com/concordances/naves-topical-bible/
 * AntConc @http://www.antlab.sci.waseda.ac.jp/software.html
 * GlossaNet @http://glossa.fltr.ucl.ac.be/
 * Unitex http://www-igm.univ-mlv.fr/~unitex/

3**. Создание частотных словарей.** Обычно частотные словари строятся на основе корпусов текстов: берется набор текстов, представительный для языка в целом, для некоторой предметной области или данного автора и из него извлекаются словоформы, леммы и части речи (последние извлекаются в случае, если корпус имеет морфологическую разметку). Проблемы при создании частотных списков заключаются в: Все эти проблемы связаны с тем, что со статистической точки зрения язык представляет собой большое количество редких событий (Закон Зипфа), в результате чего небольшое количество слов встречается очень часто, а подавляющее большинство слов имеют очень невысокую частоту. Частота слова //и// (самого частотного слова русского языка) примерно в 10 раз выше частоты слова //о//, которое в свою очередь встречается в 100 раз чаще таких обыденных слов как //путешествие, старость// или //мода//. Программы для создания частотных словарей:
 * воспроизводимости (будут ли результаты идентичны на другом аналогичном корпусе),
 * всплесках частоты отдельных слов (частота слова в одном тексте может повлиять на его позицию во частотном списке),
 * сложности определения позиции менее частотных слов, что не дает возможности ранжировать их рационально; например, слово //белиберда// входит в 20000 наиболее частотных слов, в то время, как слово //хрюкнуть// находится за пределами списка первых 40 тысяч.
 * BX Language acquisition;
 * Open Office Calc;
 * URS версия 1.1;

Ресурсы: >
 * 1) Словник. URL: http://ru.wikipedia.org/wiki/%D0%A1%D0%BB%D0%BE%D0%B2%D0%BD%D0%B8%D0%BA
 * 2) Конкорданс. URL: http://www.lomonosov-fund.ru/enc/ru/encyclopedia:0127200
 * 3) Kontext. URL: []
 * 4) Concordancing with Students. URL: []
 * 5) Частотный словарь. URL: http://ru.wikipedia.org/wiki/%D0%A7%D0%B0%D1%81%D1%82%D0%BE%D1%82%D0%BD%D1%8B%D0%B9_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C
 * 6) Создаем частотный словарь - Guide. URL: []
 * 7) BX Language acquisition. URL: []