ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ИСПОЛЬЗОВАНИЮ ИС "ЯЗЫК МЕГАПОЛИСА"
1) Для пополнения звукового корпуса новыми записями необходимо следить за форматом данных: ИС работает со звукозаписями формата PCM WAV (22050 Гц, 16 бит, моно).
2) Для работы с аннотациями и расширения объема аннотированных данных необходима установка лингвистический аннотатора ELAN, разработанный в Институте антропологических и психолингвистических исследований им. Макса Планка, Нидерланды, который является свободно распространяемым продуктом.
3) Экспорт данных их формата EAF возможен в 2-х вариантах - посредством встроенной функции ELAN (для иерархически связанных данных) или с помощью программы EAF-PROCESSOR.
4) Для корректной работы программ-обработчиков необходимо провести автоматическую коррекцию файлов аннотации программой CORRECTOR, при необходимости провести ручную правку по автоматически выданному корректором списку.
5) Для автоматической частеречной разметки словоформ используется утилита MYSTEM, разработанная компанией Яндекс, которая является свободно распространяемым продуктом.
6) Для озвучивания форм в лексикографической базе данных используется утилита MS.EXE, которая должна быть установлена в каталоге со звуковыми файлами. При перемещении базы данных или каталога SOUND для корректного воспроизведения звукозаписей необходима соответствующая настройка скриптов VBA. По умолчанию, каталогом БД является C:/MEGAPOLIS/megapolis.mdb
7) При запросе аннотатором или базой данных пути к звуковым файлам, на диске они расположены в папке MEGAPOLIS/SOUND/, при необходимости указать путь к аннотационным
шаблонам - MEGAPOLIS/ TEMPLATES/.