Корпуса+Текстов+Петербургских+Школьников

Объём корпуса составляет 38.122 словоупотребления Сбор материала проходил в школах Санкт-Петербурга и осуществлялся в рамках педагогической практики студентами 4 курса филологического факультета РГПУ им. А. И. Герцена. В качестве информантов (авторов текстов) выступили 78 учащихся 7, 9-11 классов. Родной язык информантов – русский. Возраст учащихся - от 13 до 17 лет (средний возраст 15.4 лет; стандартное отклонение - 0,8 года). В таблице 2 представлены основные характеристики Корпуса текстов петербургских школьников. **Таблица. Характеристики КТПШ** На данном сервисе представлены тексты петербургских учащихся, разделенные по типам и жанрам и синтаксически размеченные. В корпусе есть возможность свободного наполнения, т.е. любой пользователь может разместить в нем свой текст, предварительно подготовив его по имеющейся на сайте инструкции. В корпусе есть возможность свободного наполнения, т.е. любой пользователь может разместить в нем свой текст.
 * SPb****EFL****LEARNER****CORPUS** (**Корпус текстов петербургских школьников**) (http://www.spbeflcorp.ru/).
 * Признак || Тип корпуса ||
 * Тип данных || Смешанный (устные и письменные) ||
 * Язык текстов || Английский ||
 * «Параллельность» || Одноязычный ||
 * Специфичность || Содержит тексты обучающихся английскому зыку ||
 * Доступность || Свободный доступ ||
 * Назначение || Исследовательский ||
 * Динамичность || Мониторный ||
 * Разметка || Размеченный ||
 * Характер разметки || Синтаксическая разметка ошибок (errortagging) ||
 * Объем текстов || Полнотекстовый ||
 * Хронология || Диахронический ||
 * «Общность» || Общий ||

**1. Разметка текста****на ошибки**

Разметка ошибок в КТПШ была выполнена полуавтоматическим способом с помощью программ Microsoft Word и Advanced Auto Renamer.

Для того, чтобы разместить размеченный вариант текста нужно следовать предложенной в корпусе инструкции:


 * 1) Загрузите на локальный компьютер предлагаемый ниже список ошибок.
 * 2) Скопируйте текст, который будете размечать в отдельный файл редактора Microsoft Word 2007. (! в другом файле у Вас должен остаться текст без разметки!) Убедитесь, что в настройках "Правописание" - "Набор правил" выбран пункт "Строго (все правила)".
 * 3) Кликните на ошибочном варианте слова правой кнопкой мыши, и в открывшемся меню выберите пункт "Грамматика"
 * 4) Выделите слово с ошибкой цветом, соответствующим типу ошибки. Для этого воспользуйтесь инструментом "маркер".
 * 5) Впишите номер ошибки (см. список ошибок) после слова через пробел в круглых скобках.
 * 6) Пройдите по ссылке http://www.whitesmoke.com/online-writing-assistant, разместите в диалоговом окне сайта ваш неразмеченный текст
 * 7) Осуществите разметку текста, нажав на кнопку "check spelling"
 * 8) Выделите в вашем документе слово с ошибкой цветом, соответствующим типу ошибки (см. список ошибок).
 * 9) Впишите номер ошибки (см. список ошибок) после слова через пробел в круглых скобках.
 * 10) По окончании работы воспользуйтесь программой Advanced Auto Renamer, присвоив ошибкам соотвествующие названия.
 * 11) Сохраните документ в формате HTML присовив ему имя типа «textcode»_error tagged.htm (веб-страница с фильтром);
 * 12) Отправьте полученный документ на электронный адрес администрации сайта. Ваш текст будет добавлен в корпус после рассмотрения его администратором сайта.

Практически все уже существующие на данном сервисе тексты размечены на ошибки.

**2. Синтаксическая разметка текста**

Кроме разметки на ошибки, сервис предлагает пользователю разметить текст синтаксически. Для синтаксической разметки текстов корпуса предлагается использовать сервис Machinese Syntax © компании Connexor Oy. Для того, чтобы разместить размеченный вариант текста нужно также проследовать предложенной инструкции:


 * 1) Добавьте текст в массив корпуса с помощью сервиса corpus builder;
 * 2) Загрузите (пункт "Сохранить как") шаблон для синтаксической разметки текста на свой компьютер;
 * 3) Перейдите на страницу сервиса Machinese Syntax ©;
 * 4) Введите в текстовое поле текст. В выпадающем меню ниже выберите пункт "English text" и нажмите кнопку "Apply syntax";
 * 5) Выделите сформированный текст таблицы, включая элементы шапки таблицы (#, Text, Basefor etc.). Откройте исходный HTML-код выделенного фрагмента и скопируйте код в буфер обмена;
 * 6) Откройте сохранённый шаблон и вставьте код из буфера обмена в указанное в нем место;
 * 7) Сохраните документ в формате HTML присовив ему имя типа _parsed.html;
 * 8) Отправьте полученный документ на электронный адрес администрации сайта. Ваш текст будет добавлен в корпус после рассмотрения его администратором сайта.

**3. Создание конкорданса**

Для создания конкордансов используется программа AntConc. В корпусе дано подробное описание этой программы, а также ссылка для скачивания и тексты для работы с программой. **4. Наполнение сервиса**

Для того чтобы добавить текст в корпус, сначала нужно выбрать раздел CorpusBuilder (конструктор корпуса).

Перед тем как добавить свой текст, нужно заполнить следующие поля:


 * тип текста (эссе, письмо другу, монолог, диалог),
 * уникальный идентификатор (ID),
 * возраст, пол, школа, класс,
 * родной язык, второй язык,
 * дополнительное образование (подготовительные курсы, репетитор, не занимается),
 * уровень владения языком (новичок, начальный, ниже среднего, средний, выше среднего, продвинутый),
 * тема.

И последнее, вставить свой текст в соответствующее поле.