27 ноября 2024 года состоялось очередное заседание научного семинара «Цифровая среда», на котором в качестве докладчиков выступили доцент Школы лингвистики НИУ «ВШЭ», старший научный сотрудник Лаборатории цифровых исследований литературы и фольклора Института русской литературы РАН Борис Орехов и исследователь и координатор DH-проектов в Университете Потсдама, главный редактор издания о цифровых технологиях в гуманитарных науках «Системный Блокъ» Даниил Скоринкин.
Речь шла о векторных семантических моделях, которые известны как мощный инструмент, используемый в IT-индустрии в качестве средства обработки естественного языка, позволяющего с опорой на контекст (а не на экспертное знание) установить близость или удаленность значения различных слов. Академические лингвисты научились использовать свойства векторов слов для получения нового знания о функционировании семантики. Алгоритмы векторизации эффективно обобщают информацию о семантике и морфологии языковых единиц. Докладчики акцентируют внимание на том, что необходимо научиться использовать их в computational literary studies, не теряя литературоведческого смысла этого действия.
Исследователи рассказывают: «На основе большого корпуса русской прозы XIX века мы создали векторную модель персонажей русской литературы. Для этого пришлось преодолеть ряд технических трудностей, которые все еще влияют на результат. Но благодаря этой модели мы теперь представляем, какие персонажи похожи друг на друга по своему описанию (контексту), как эспрессо и капучино в бытовых текстах, и почему. Анна Каренина – ассоциат (векторная сестра) княжны Марьи из «Войны и мира», что имеет прямой литературоведческий смысл, а вот ближайшим ассоциатом Андрея Болконского является не похожий на него Пьер Безухов».
Подробнее в записи онлайн-семинара:
– YouTube: https://youtu.be/qZ0i9oSYSUY
– Rutube: https://rutube.ru/video/e3db9a6cf0eb95e019d2538beeba6bb1/
– VK Видео: https://vk.com/video-222835606_456239023