Русская редакция

Summa Technologiae: Как компьютер читает поэзию

06.10.2021 16:10
Компьютерные исследования поэзии - это часть большого проекта «Корпус четырех пророков» Института литературных исследований ПАН.
Аудио
  • Анна Менджецкая и Эва Мирковская о том, как компьютер читает поэзию.
             25-    .
Анна Менджецкая и Эва Мирковская на встрече "Как омпьютер читает поэзию" в рамках 25-го Фестиваля науцки в Варшаве.Фото: И. Завиша

Современные компьютерные инструменты позволяют посмотреть на поэзию совершенно иначе, чем мы привыкли. Благодаря им, можно лучше узнать язык, которым пользовались авторы, а также узнать что-то новое о нашем собственном восприятии литературы. На встрече под названием «Как компьютер читает поэзию» в рамках 25-го Фестиваля науки в Варшаве  кандидат наук Эва Мирковская (Ewa Mirkowska)  и аспирантка из Института литературных исследований Польской академии наук (ПАН) Анна Менджецкая (Anna Mędrzecka) представили как, выглядит подготовка текстов для исследований на примере группы текстов Адама Мицкевича и Юлиуша Словацкого, и познакомили с цифровыми инструментами, которые используют литературоведы, изучающие творчество польских поэтов-романтиков. Присутствующие также могли проверить, какие слова чаще всего встречаются в их поэзии, и может ли компьютер отличить Словацкого от Мицкевича.

- После такой интересной презентации я просто не могла не пригласить обеих ученых к микрофону.

- Как было сказано на встрече - компьютер читает поэзию без присущих даже самому строгому критику эмоций. В чем смысл применения компьютера для чтения поэзии?

Анна Менджецкая: Действительно, он читает поэзию неэмоционально, что может быть плюсом, но также и минусом. Благодаря компьютерному анализу можно подтвердить разные исследовательские гипотезы, например, на основании анализа частоты присутствия слов или исследования особенностей литературного стиля, которые не так часто улавливаются невооруженным глазом исследователя. Можно также, к нашему удивлению, верифицировать свои взгляды и выводы, например: часто ли поэты-романтики пишут о любви, или какие слова используют чаще, и каковы объекты их заинтересованности.

- Чтобы компьютер ответил на такие вопросы, надо сформулировать определенные критерии. Какими параметрами пользуются исследователи поэзии, чтобы представить задание компьютеру?

Анна Менджецкая: Мы должны принять во внимание два аспекта. Первый: что именно мы хотим узнать, какой конкретный вопрос хотим задать компьютеру. А второй - каковы возможности компьютера, и что он может нам сказать. Если мы учтем эти два критерия, то увидим, что  количество твердых данных, которые компьютер в состоянии нам выдать, весьма ограничено. При этом мы знаем, как эти данные интерпретировать. Благодаря этому мы можем спросить компьютер, например, о свойствах стиля, и только потом, на основании его ответа поставить себе очередной вопрос. Например, из чего эти стилевые особенности вытекают, и что они нам показывают.

- Компьютерные исследования поэзии - это часть большого проекта «Корпус четырех пророков». Какова его концепция, специфика и цель? С этим вопросом я обратилась к кандидату наук Эве Мирковской:

Эва Мирковская: Для нас в определенный момент стало очевидным, что отстуствие цифровых инструментов для анализа языка таких выдающихся творцов польской культуры как Словацкий, Мицкевич, Красиньский и Норвид - это недостаток, который не может дальше продолжаться. Поскольку лишает возможности анализировать как диалекты отдельных творцов, язык которых в огромной степени влиял на язык польской нации. Кроме того, без компьютера практически невозможно проводить сравнительный анализ между языками этих поэтов. А это колоссальная потеря для науки. Сейчас появились возможности восполнить этот пробел, и наш «Корпус четырех пророков» является первой версией уникального и новаторского для польского языка ресурса, который нацелен на представление лексического слоя языков четырех поэтов-пророков, как указывает само название проекта. Одновременно проект дает возможность исследования языка каждого из них по отдельности, так и сравнений в различных конфигурациях. Такую возможность дает нам именно компьютер. Мы должны обработать метаданные и систему аннтотации, чтобы дать компьютеру материал, который он сможет понять и интепретировать, чтобы представить нам интересующие нас результаты. А мы сможем произвести определенные сравнения и пытаться делать анализ по тем критериям, которые будут нам доступны. Идея «Корпуса четырех пророков» заключается в том, чтобы он в самом скором темпе пригодился исследователям для высокоспециализированных потребностей, так и для рядовых читателей, которые хотят узнать, например, как часто в позднем периоде творчества Словацкого появляется слово «любовь».

- На встрече очень интересно говорилось о методе стилометрии. Вы могли бы приблизить его нашим слушателям? Анна Менджецкая:

Анна Менджецкая: Метод стилометрии, говоря коротко и в упрощении, состоит в том, что мы даем компьютеру для анализа группу текстов, и просим его выбрать такие критерии, которые позволят ему определить сходные черты этих текстов. Целевой подход таков, что этот метод может нам позволить определить авторство одного из выбранных текстов на основе его похожести или различий по сравнению с остальными. Пока этот метод нельзя назвать доскональным, при этом его результаты весьма многообещающие. И думаю, что наш «Корпус» может позволить усовершенствовать этот инструмент.

- Наверняка преподаватель, который воспользуется такой методикой, не вызовет оскомину скуки у учеников и студентов, которую вызывал профессор - герой известной повести Витольда Гомбровича «Фердидурка», чьим единственным обоснованием призыва читать Словацкого была сакраментальная фраза, что «Словацкий великим был поэтом!».

Эва Мирковская: (Со смехом) Мы надеемся, что компьютер нам покажет, насколько действительно он был великим. Его универсальное видение сердца является уникальным путем, который нам вышел во время исследований. При этом Словацкий по той причине, что создавал удивительные и странные словосочетания, более труден для восприятия. Мы надемся, что нам удастся показать, насколько он отличался от других, причем иным способом, чем считалось до сих пор. Думаю, что скоро цифровые методы станут настолько повсеместными, что такими инструментами и ресурсами, которые мы сейчас создаем, можно будет пользоваться также в лицеях.

Автор передачи: Ирина Завиша

Больше на тему: Summa Technologiae культура