БАЗА ДАННЫХ КОММУНИКАТИВНЫХ СЦЕНАРИЕВ повседневной речи
Структура Базы данных

Таблица Informants (Информанты) содержит следующие, в основном социологические, поля описания:
SCode (код информанта), SName (псевдоним информанта), Gender (пол), Age (возраст), PBirth (место рождения), SClass (социальное происхождение), Education (образование), Qual (специальность по диплому), Prof (профессия) и некот. др.

Таблица Communicants (Коммуниканты)
содержит уникальный код коммуниканта по базе данных (CCode), код основного информанта (SCode), социальную роль коммуниканта (Who), социальную роль, нормализованный код (WhoCode), а также социологическую информацию по структуре, представленной в табл. Informants.

Таблица SoundFiles (Звуковые файлы)
представляет информацию об исходной звукозаписи: SCode (код информанта), SFile (звуковой файл), TTime (общее время звучания), RTime (полезное время звучания), Comments (комментарии) и др.

Таблица MacroEpisodes (Макроэпизоды)
содержит информацию об относительном положении макроэпизода во временной развертке исходной звукозаписи (SFileW - имя оригинального звукового файла, начальная (Start) и конечная (End) временная метка относительно исходного файла), SFName - код макроэпизода, EPlace (место коммуникации), EAction (основная прагматическая задача коммуникации), EWho (участники коммуникации), Duration - длительность, NComType - тип коммуникативного эпизода нормализованный (код), NPlace - Место эпизода нормализованное (код), NSRole - Социальная роль информанта нормализованная (код).

Таблица Participants (Участники)
связывает данные о макроэпизодах и участниках коммуникации: Speaker - код говорящего, MacroEpisode - код эпизода (звукового файла), SCodeTr - код говорящего по транскриптам расшифровки, SocRole - социальная роль говорящего в конкретном эпизоде.

Таблица MicroEpisodes (Микроэпизоды)
содержит информацию об относительном положении микроэпизода в соответствующем макроэпизоде (SFName - код макроэпизода, начальная (Start) и конечная (End) временная метка в соответствующем макроэпизоде), MEName - название микроэпизода, MECode - код микроэпизода, Pragm - доминантная прагматическая задача, Emot - эмоциональный фон, NVec - количество векторов коммуникации, SucCom - формальная оценка успешности коммуникации, CMarks - маркеры коммуникации, NComType - тип коммуникативного сценария (код), NSRole - соц. роль информанта нормализованная (код), NPlace - место эпизода нормализованное (код), Comments - комментарии, DurMS - длительность (мс), Dur длительность (мин).

Таблица SpeechActs (Речевые акты, РА)
содержит следующие данные: N - номер РА в макроэпизоде, RASFName - имя соответствующего файла аннотации, начальная (StartT) и конечная (EndT) временная метка в соответствующем макроэпизоде, DurMS - длительность (мс), RAct - орфографическая расшифровка РА с синтагматическим членением, Frase - реплика, частью которой является данный РА, Episode - название микроэпизода, Voice - качественные изменения голоса, Events - невербальные аудиособытия, RActGenT - общий тип РА, RActDetT - подтип РА, RActSp - код говорящего (по расшифровке), RActSpN - код говорящего (уникальный), SFName -референтный макроэпизод.

Таблица MiniEpisodes (Миниэпизоды, МЕ)
содержит следующие данные: N - номер РА в макроэпизоде, ORDSoundFile -референтный макроэпизод, начальная (StartT) и конечная (EndT) временная метка в соответствующем макроэпизоде, MECode - код МЕ, Speaker - код говорящего по транскрипту, Duration - длительность (мс), MEpisode - текстовое наименование миниэпизода, MEPragmatic - прагматическая задача, MEStimul - референтный код стимула (внешнего или коммуникативного), Frase - реплика в орфографической записи, SCode - код говорящего, Episode - название микроэпизода.

Таблица Psychologie (Психологические характеристики)
содержит основные SCode (код информанта), SName (псевдодим информанта), IE (экстраверт-интроверт), Temp (темперамент), Nev (уровень невротизма).

Таблица Utterances (коммуникативные реплики)
содержит следующие данные: SFile - код макроэпизода, начальная (StartT) и конечная (EndT) временная метка в соответствующем макроэпизоде, Duration - длительность (мс), Frase - орфографический транскрипт реплики с синтагматическим членением, Frase_WC - количество слов в реплике, Frase_SC - количество слогов в реплике, SCodeTr - код говорящего по транскрипту, SCode - код говорящего.

Таблица Syntax (синтаксические структуры)
содержит следующие данные: SFile - код макроэпизода, начальная (StartT) и конечная (EndT) временная метка в соответствующем макроэпизоде, Frase - орфографический транскрипт реплики с синтагматическим членением, SynCode - синтаксический код реплики, Notes - комментарий, SCode - код говорящего.

Таблицы Paralinguistics и Extralinguistics
содержат выгруженную из корпуса аннотационных файлов паралингвистическую и экстралингвистическую информацию по единой схеме: SFile - код эпизода, начальная (StartT) и конечная (EndT) временная метка в соответствующем макроэпизоде, Dur - длительность события (мс), Voice (паралингвистическое) или Event (экстралингвистическое) событие соответственно. Таблица Extra-Notes содержит дополнительные комментарии.

Источники данных для таблиц: 1) социологические и психологические анкеты (для информации об участниках коммуникации), 2) экспертная работа (информация о макроэпизодах и участниках коммуникации), 3) импорт данных из корпуса аннотаций формата ELAN (для большинства остальных таблиц).

Структура базы данных и внутренние связи между таблицами объектов описания позволяет проводить статистический анализ коммуникативных сценариев непосредственно в среде MS Access благодаря использованию сложных запросов и скриптов. Использование специальной утилиты ms.exe, вызываемой из форм базы данных, позволяет озвучивать фрагменты звукозаписей по них начальной-конечной метке без предварительного сохранения фрагмента звукозаписи как отдельного файла.