Почти 2000 лет назад извержение Везувия «поджарило» древнеримский Геркуланум, похоронив огромную библиотеку под 20-метровым слоем пепла — некоторые свитки в конце концов откопали, однако большинство оставалось «нечитабельными» до сегодня, пока «не пришел» искусственный интеллект.
Лаборатория Брента Силза в Университете Кентукки много лет испытывает метод «виртуального развертывания» для расшифровки древних текстов. Команда сочетает цифровое сканирование с микрокомпьютерной томографией — неинвазивным методом, который часто используют для визуализации рака — с сегментацией для цифрового создания страниц, дополненных методами текстурирования и сведения. Силз для этого разработал собственное программное обеспечение Volume Cartography, которое в 2016-м уже помогло команде «просмотреть» свиток Эн-Геди, найденный на западном берегу Мертвого моря, с несколькими первыми стихами из книги Левит.
Впрочем, работа над свитками из Геркуланума осложнялась тем, что чернила изготовлены на основе угля и воды (чернила на свитке Эн-Геди содержат металл, который ярко светится на компьютерной томографии), хотя в конце концов Силз понял, что КТ все-таки может найти крошечные различия в текстуре, которые укажут на участки папируса с текстом, и научил искусственную нейронную сеть делать именно это.
В 2019 году исследователь перевез два неповрежденных свитка в синхротронную рентгеновскую установку вблизи Оксфорда и сделал сканы с высоким разрешением, которые впоследствии использовали для конкурса Vesuvius Challenge, запущенного в марте прошлого года. Около 1500 команд получили шанс заработать несколько сот тысяч долларов в случае успешной расшифровки текста.
Прошлой осенью с помощью машинного обучения в одном из древних свитков удалось распознать некоторые буквы и даже слова — а сейчас объединенная команда из трех участников расшифровала 15 колонок текста:
«Автор [вероятно, Филодем] пишет о музыке, еде и о том, как наслаждаться радостями жизни», — пишут организаторы. «В заключительном разделе он бросает тень на неназванных идеологических противников — возможно, стоиков? — которым «нечего сказать об удовольствии, ни в целом, ни по отдельности».
Команду в составе Люка Фаритора, Юсефа Найдера и Джуллиана Шиллингера наградили денежным призом в размере $700 тыс.
Однако 15 колонок — это всего 5% от общего содержания свитка. Для следующего Vesuvius Challenge, который уже объявили, предлагают $100 000 за расшифровку 90% из четырех свитков, отсканированных на данный момент. Одна из задач этого челленджа — усовершенствование автоматической сегментации текстов, поскольку ручное выполнение требует много времени и денег (более $100 за квадратный сантиметр).
Источник: Ars Technica