СПЕЦИАЛИЗИРОВАННЫЕ ПРОГРАММНЫЕ СРЕДСТВА обработки данных
Лингвистический аннотатор ELAN
Для использования информационной системы коммуникативных сценариев в полном объеме необходимо предварительная установка аннотационного пакета ELAN, разработка Института антропологических и психолингвистических исследований им. Макса Планка, Нидерланды), которая является свободно распространяемым продуктом. В ELANe осуществляется мультимедийная разметка речевого потока (макроэпизодов) на микроэпизоды, реплики и речевые акты, для пакетной обработки и поиска данных используются встроенные функции. Имеется небольшой статистический функционал.
EAF-PROCESSOR
Импорт аннотированных данных в информационную систему осуществляется в двух режимах: 1) стандартном, представляемом самой системой ELAN и 2) посредством утилиты eaf-processor, которая была специально разработана для обработки аннотаций звукового корпуса и настраиваемого экспорта структурированных данных их формата EAF/XML в табличную форму MS Excel/Access.
MS ACCESS
Для решения большинства стандартных задач по анализу реализации коммуникативных сценариев (фильтрации, поиска, сложных запросов, статистических подсчетов) достаточно использования встроенных ресурсов MS Access.
MS.EXE
Для озвучивания звуковых фрагментов в формах базы данных используется утилита ms.exe.
EAFER.EXE
Разработаны программные средства для автоматизации технически сложной задачи разведения транскриптов речи по разным говорящим. Необходимость в решении этой задачи определяется большим процентом речевой коммуникации, в котором ее участники говорят одновременно. Вследствие принятого в корпусе как базовый линейного аннотирования речи, значительная часть речевого потока оказывалась "в зоне пересечения", тем самым было невозможно выделить речь только одного или только второго диктора. Разработка утилиты eafer.exe позволила решить эту проблему.