Неделя DH в Петербурге 2021: Корпус древнерусских текстов "своими руками": смысл, задачи, технологии

Лектор: Дмитрий Добровольский

Наука 16+

Разрабатываемые лингвистами корпусные технологии способны существенно расширить исследовательские возможности, гуманитариев всех специальностей — историков, филологов, философов и т.д. Однако применение данного класса технологий в изучении истории средневековой Руси сдерживается из-за отсутствия в открытом доступе лингвистически аннотированных текстов ряда принципиальных для соответствующего предметного поля исторических источников. Ситуация несколько улучшается в последнее время. В частности, успешно функционирует база данных по берестяным грамотам, а в Древнерусском подкорпусе Национального корпуса русского языка (НКРЯ) представлено около 30 памятников XI–XIV вв., включая большинство ранних русских летописей, важнейший памятник древнерусского законодательства — Русскую Правду, ряд учительных и агиографических сочинений. Однако этот корпус по-прежнему нерепрезентативен (так, полностью отсутствуют актовые источники, не представлено церковное законодательство, а среди агиографии нет важнейших памятников — Жития Феодосия Печерского и сочинений борисоглебского цикла), а его технологическая база поддерживает лишь простейшие запросы и не допускает массированную обработку данных, что может быть необходимо, например, для изучения количественных характеристик авторского стиля. В этой ситуации актуальной задачей становится создание открытого инструмента, с помощью которого исследователи могли бы самостоятельно размечать нужные им тексты, не дожидаясь, пока они попадут в «сферу интересов» НКРЯ, производить автоматизированную обработку размеченных источников (в т.ч. технологиями, характерными для работы с big data), и обмениваться результатами своей работы в открытом формате.

Предметом предлагаемого выступления станет оригинальная программа-лемматизатор, написанная автором для решения конкретных исследовательских задач, используемый в ней формат обмена исследовательскими данными, а также возможности и проблемы масштабирования найденных ad hoc решений для внедрения в широкую исследовательскую практику.

Требования к участникам: нет

Оборудование: не требуется

Лекция пройдет в Zoom, для получения ссылки на онлайн-конференцию необходимо зарегистрироваться. Количество мест ограничено.

О спикере: 

Дмитрий Добровольский, кандидат исторических наук. Окончил РГГУ по специальности «Историография, источниковедение и методы исторического исследования». Тема диссертации: Этническое самосознание древнерусских летописцев XI—начала XII в.

Вступайте в группу SPB DHweek 2021, там публикуется вся информация о мероприятиях, спикерах и конкурсах: https://vk.com/spbdhweek

Поделиться:

1201 день назад
27 января 2021 19:00–20:30

Событие пройдет онлайн

Уже есть билет
Ссылка на онлайн-событие рассылается за час до его начала.
Получить ссылку

Поделиться:

Связь с организатором

На этот адрес придёт ответ от организатора.

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов