Ученые восстановили текст свитка из Геркуланума с помощью искусственного интеллекта
Две тысячи лет назад вулкан Везувий уничтожил римский город Геркуланум, засыпав его пеплом на 20 метров. Под этим слоем оказалась огромная библиотека, содержащая тысячи свитков с древними текстами.
Большинство из них до сих пор не могли прочесть, так как они были слишком хрупкими и поврежденными. Но теперь ученым удалось расшифровать один из свитков с помощью искусственного интеллекта.
Брент Силз, профессор компьютерных наук из Университета Кентукки, разработал специальный метод “виртуального разворачивания” свитков, который использует цифровое сканирование, микрокомпьютерную томографию и нейронные сети. Его команда уже применила этот метод к свитку Эн-Геди, обнаруженному на берегу Мертвого моря, и восстановила несколько стихов из книги Левит.
Однако свитки из Геркуланума представляли больший вызов, так как их чернила были сделаны из угля и воды, а не из металла, как на свитке Эн-Геди. Это означало, что они плохо видны на томографии. Но Силз нашел способ обнаружить маленькие разницы в текстуре папируса, которые указывали на наличие текста, и обучил свою нейронную сеть распознавать их.
В 2019 году Силз взял два целых свитка из Геркуланума и отвез их на синхротрон в Оксфорде, где сделал сканы высокого качества. Затем он запустил конкурс Vesuvius Challenge, в котором пригласил других исследователей попытаться расшифровать текст свитков с помощью машинного обучения. Более 1500 команд приняли участие в конкурсе, который предлагал приз в размере нескольких сотен тысяч долларов.
В прошлом году одной из команд удалось выделить некоторые буквы и слова из одного из свитков. А недавно команда, состоящая из Люка Фаритора, Юсефа Найдера и Джуллиана Шиллингера, смогла расшифровать 15 колонок текста. Оказалось, что автор свитка (вероятно, философ Филодем) писал о музыке, еде и удовольствиях жизни. В конце он критиковал своих идеологических оппонентов (возможно, стоиков), которые не могли понять смысл наслаждения. Команда получила приз в 700 тысяч долларов за свое достижение.
Но это только начало. Силз объявил о новом конкурсе, в котором предлагает 100 тысяч долларов за расшифровку 90% текста из четырех свитков, которые он уже отсканировал. Он также надеется улучшить свой метод автоматической сегментации текстов, чтобы ускорить и удешевить процесс. Сейчас он тратит более 100 долларов за квадратный сантиметр папируса.
Свитки из Геркуланума являются уникальным источником знаний о древнем мире. Они содержат произведения по философии, литературе, медицине, астрономии и другим наукам. Благодаря искусственному интеллекту мы можем наконец прочитать их и узнать, что они скрывают.