Разрабатываемые лингвистами корпусные технологии способны существенно расширить исследовательские возможности, гуманитариев всех специальностей — историков, филологов, философов и т.д. Однако применение данного класса технологий в изучении истории средневековой Руси сдерживается из-за отсутствия в открытом доступе лингвистически аннотированных текстов ряда принципиальных для соответствующего предметного поля исторических источников. Ситуация несколько улучшается в последнее время. В частности, успешно функционирует база данных по берестяным грамотам, а в Древнерусском подкорпусе Национального корпуса русского языка (НКРЯ) представлено около 30 памятников XI–XIV вв., включая большинство ранних русских летописей, важнейший памятник древнерусского законодательства — Русскую Правду, ряд учительных и агиографических сочинений. Однако этот корпус по-прежнему нерепрезентативен (так, полностью отсутствуют актовые источники, не представлено церковное законодательство, а среди агиографии нет важнейших памятников — Жития Феодосия Печерского и сочинений борисоглебского цикла), а его технологическая база поддерживает лишь простейшие запросы и не допускает массированную обработку данных, что может быть необходимо, например, для изучения количественных характеристик авторского стиля. В этой ситуации актуальной задачей становится создание открытого инструмента, с помощью которого исследователи могли бы самостоятельно размечать нужные им тексты, не дожидаясь, пока они попадут в «сферу интересов» НКРЯ, производить автоматизированную обработку размеченных источников (в т.ч. технологиями, характерными для работы с big data), и обмениваться результатами своей работы в открытом формате.
Предметом предлагаемого выступления станет оригинальная программа-лемматизатор, написанная автором для решения конкретных исследовательских задач, используемый в ней формат обмена исследовательскими данными, а также возможности и проблемы масштабирования найденных ad hoc решений для внедрения в широкую исследовательскую практику.
Требования к участникам: нет
Оборудование: не требуется
Лекция пройдет в Zoom, для получения ссылки на онлайн-конференцию необходимо зарегистрироваться. Количество мест ограничено.
О спикере:
Дмитрий Добровольский, кандидат исторических наук. Окончил РГГУ по специальности «Историография, источниковедение и методы исторического исследования». Тема диссертации: Этническое самосознание древнерусских летописцев XI—начала XII в.
Вступайте в группу SPB DHweek 2021, там публикуется вся информация о мероприятиях, спикерах и конкурсах: https://vk.com/spbdhweek
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.