Книги о Гарри Поттере стали инструментом для экспериментов с генеративным ИИ

Книги о Гарри Поттере, популярные во всем мире, стали объектом интереса для исследователей в области искусственного интеллекта (ИИ).

С их помощью они проводят эксперименты с генеративными моделями ИИ, которые могут создавать тексты на основе обучающих данных. Однако такие модели могут нарушать авторские права, если они копируют или воспроизводят защищенный контент. Поэтому ученые разрабатывают способы удалять из памяти ИИ определенную информацию, не ухудшая его качество.

Согласно Bloomberg, за последние месяцы было опубликовано несколько научных работ, в которых книги Джоан К. Роулинг о Гарри Поттере использовались для работы с ИИ. Например, в одной из работ специалисты из Microsoft показали, как можно изменить или редактировать модели ИИ, чтобы они не содержали никаких упоминаний о книгах о Гарри Поттере, включая имена персонажей и события сюжета. При этом общая функциональность системы ИИ не пострадала.

Главный технический директор Microsoft Azure Марк Руссинович объяснил, что такой подход позволяет исследователям легко проверить, что модель действительно “забыла” контент. Он отметил, что даже те, кто не читал книг, знают некоторые элементы истории и персонажей.

В другой работе ученые из Университета Вашингтона в Сиэтле, Университета Калифорнии в Беркли и Института Аллена по вопросам ИИ представили новую языковую модель под названием Silo, которая может удалять данные, чтобы снизить юридические риски. Они также использовали книги о Гарри Поттере, чтобы изучить, как отдельные фрагменты текста влияют на производительность системы ИИ. Оказалось, что удаление книг о Гарри Поттере из обучающих данных снижает точность модели.