Информационная система выполнена на материале наиболее представительного на сегодняшний день корпуса звукозаписей языка повседневного общения – Звукового корпуса русского языка (ЗКРЯ), включающего два модуля – корпус звукозаписей САТ («Сбалансированная Аннотированная Текстотека») и корпус «Один речевой день» (ОРД).
Звуковой корпус русского языка позволяет осуществлять мониторинг современной повседневной речи, фиксировать язык в его наиболее естественной форме, а также получать материал для многоуровневого описания русской звучащей речи.
Работа над созданием Звукового корпуса началась на Филологическом факультете СПбГУ еще в 2007 году и проводилась по двум направлениям, акцентирующим исследовательское внимание на двух разных типах повседневной речи. В результате ЗКРЯ включает два блока (модуля), устроенных принципиально по-разному, но преследующих общую цель — фиксацию состояния современной русской речи во всем ее жанровом и тематическом разнообразии, в неразрывной связи как с ситуацией общения, так и с говорящим индивидом и его социальными отношениями с собеседниками (коммуникантами).
Первый блок корпуса — Сбалансированная Аннотированная Текстотека — изначально достаточно строго сбалансирован по разным параметрам — социологически, психологически и собственно лингвистически. Лингвистическая балансировка материала заключается в том, что все тексты построены в рамках коммуникативных сценариев, наиболее типичных для повседневной коммуникации: чтение и пересказ (сюжетного и несюжетного исходных текстов); описание изображения (также сюжетного и несюжетного); свободный рассказ на заданную тему (знакомую и незнакомую для говорящего).
Социолингвистическая балансировка материала предполагает учет социальных характеристик информантов, таких как пол, возраст, профессиональная принадлежность, профессиональное или непрофессиональное отношение к речи, уровень речевой компетенции и некоторые другие.
Вторым блоком Звукового корпуса является модуль «Один речевой день», который ставит своей целью изучение речевого поведения носителя языка в течение дня (с использованием методики 24-часовой записи). Приоритетная задача создания данного корпуса заключалась в том, чтобы получить записи русской спонтанной речи в максимально естественных условиях.
Запись модуля ОРД проводилась с использованием диктофона, закрепленного на информанте стационарно, в течение целого дня (иногда — нескольких дней). Каждый информант должен был вести своеобразный дневник «речевого дня», указывая в нем своих коммуникантов, а также ситуацию, в которой происходила коммуникация (например, «в магазине», «в метро», «общение с друзьями» и т. п.). Кроме того, все информанты, участвующие в записи, заполняли социологическую анкету и проходили психологическое тестирование, что открывает новые возможности исследования материала — с учетом социальных и психологических характеристик говорящего, а также его социальной роли в конкретном коммуникативном акте.
Принципы собирания речевого материала, применяемые в двух модулях Звукового корпуса русского языка, и методики получения разнообразной социологической информации о говорящих позволяют ставить и решать задачи, связанные с исследованием разных характеристик современной речевой коммуникации.
Информационная система «Язык мегаполиса», представленная на данном сайте, посвящена исследованию языка повседневного общения на лексическом уровне.