КОРПУС ФАЙЛОВ-АННОТАЦИЙ РЕЧЕВОГО МАТЕРИАЛА

Аннотирование коммуникативных макроэпизодов.
Аннотирование речевого материала на уровне коммуникативных макроэпизодов выполнено для всего отобранного материала (635 макроэпизодов в первый год реализации проекта, 475 макроэпизодов - во второй год, всего 1110 эпизодов общей длительностью 288 часов). Результаты аннотирования представлены в таблице MacroEpisodes информационной базы.

Аннотирование коммуникативных микроэпизодов.
Сегментация и первичное аннотирование речевого материала на уровне микроэпизодов выполнено в формате ELAN (*.eaf) для всего речевого материала, для которого были выполнены текстовые расшифровки речи (150 макроэпизодов, 40 часов звучания) в 2013г. На заключительном этапе реализации проекта 183 микроэпизодов для 6 информантов в разных условиях коммуникации было проаннотировано с применение углубленной системы описания (прагматическая задача, эмоциональный фон, тип коммуникативного сценария, место коммуникации, социальная роль, формальная оценка успешности коммуникации, наличие коммуникативных маркеров, количество векторов коммуникации). Результаты аннотирования представлены в таблице MicroEpisodes информационной базы.

Аннотирование речевых актов.
Осуществлено членение (сегментация) речевого материала на речевые акты с параллельным аннотированием: а) с указанием общего иллокутивного типа (репрезентативы, директивы, комиссивы, экспрессивы, вердиктивы, регулятивы), б) с указанием конкретного подтипа. По результатам пилотного аннотирования была адаптирована ранее разработанная методика. Проаннотированы речевые акты повседневной коммуникации для речевого материала, полученного от 6 информантов. В дополнение к запланированным информантам S05, S15, S24 и S35, продемонстрировавшим наибольшее коммуникативное разнообразие, выполнена аннотация на речевые акты макроэпизодов информантов S01 и S19, интересных с коммуникативной точки зрения: разговор во время прогулки (S01), конфликтная ситуация (S19). Общий объем проаннотированного материала - 2250 речевых актов для 6 информантов, формат ELAN. Результаты аннотирования содержатся в корпусе файлов формата *.eaf и представлены в таблице SpeechActs базы данных.

Пилотное аннотирование коммуникативных миниэпизодов.
Поскольку в процессе аннотирования материала на речевые акты выявились структуры мельче микроэпизодов, объединяющие один или несколько речевых актов, была предпринята попытка их аннотирования с использованием нелинейной разметки. В результате сплошного аннотирования материала на речевые акты оказалось, что в речевой коммуникации системно выделяются и более мелкие структуры, чем "микроэпизод" в терминологии данного проекта, объединяющие Эти структуры получили название "миниэпизода", была дополнительно разработана методика их аннотирования, отражающего их прагматику и генезис (коммуникативный или внешний стимул). Пилотное аннотирование на миниэпизоды выполнено на материале речевой коммуникации информанта S01 (фрагмент макроэпизода S01-02) Результаты аннотирования представлены в файле ractS01-02 и таблице ME-Utterances.