Изкуствен интелект чете свитъци от древноримска библиотека, унищожена от изригване на вулкан

Изкуственият интелект се справя със задачата на няколко етапа

 

Благодарение на машинното обучение археологията направи голям скок напред. ИИ е разработил метод за разчитане на изгорели или повредени по друг начин папирусови свитъци. Такива документи са много и се откриват все повече. Технологията все още не е усъвършенствана, но първите резултати са успешни.

Още през XVIII в. при разкопки на римска вила в Херкулан са открити повече от 1000 цели или частични свитъка в имение, за което се смята, че е принадлежало на тъста на Юлий Цезар. Изригването на Везувий през 79 г. от н.е. и последвалото погребване на свитъците в земята ги превръща в овъглени останки, които могат да бъдат разгънати само веднъж – те се разпадат. Текстовете също били нечетими, тъй като мастилото изгоряло заедно с основата.

За да прочетете всичко това и още нещо, си струва да положите усилия. Усилията за създаване на технологията за разчитане на овъглените свитъци от Херкулан от години се ръководят от компютърния учен Брент Сийлс от Университета в Кентъки. Той и екипът му, използвайки рентгенова томография в Диамантения източник на светлина, синхротронен източник на светлина от трето поколение в Оксфордшир, се научиха да разпознават следи от мастило във влакната на папируса, без да докосват или унищожават свитъка.

Но разпознаването на мастилото е само началото. Било е необходимо да се “разгърне” свитъкът и да се прочете текстът. За тази цел през 2023 г. е обявено състезанието Vesuvius Challenge с награда от около 1 млн. долара с пари от спонсори. До края на годината започват да се определят лидерите. Студентът по компютърни науки в Университета на Небраска-Линкълн Люк Фаритор е обявен за победител в етапа “Първи букви” за дешифриране на първите последователни фрази от изгорения текст, за което получи 40 000 долара. По-късно към Фаритор се присъединиха Юсеф Надер от Германия и Джулиан Шилигер от Швейцария. Те разработват алгоритъм за “разгръщане” на свитъците. Заедно те успели да разчетат повече от 2000 букви от свитъка. Както стана известно онзи ден, наградата от 700 хил. долара е отишла при този екип.

Изкуственият интелект се справя със задачата на няколко етапа. Свитъкът е разделен на сектори, като всеки слой е дефиниран. Предложени са няколко начина за решаване на тази загадка. Например, изкуственият интелект проследява паяжината от пукнатини във всеки слой, което му позволява да определи точно слоя и след това да подравни цифрово копие от него. Това е може би най-сложната част от работата. Разпознаването на буквите от гръцката азбука също не идва директно от текста, което е важно за валидиране на експертизата на екипа с външни изследователски екипи. Всички данни се вземат от база данни, получена чрез рентгенова томография, а не от софтуер за оптично разпознаване на символи. Важно е също така, че кодът, предложен от спечелилия екип, е с отворен код и може да се използва от други екипи за валидиране на резултатите. И те са били валидирани. Изкуственият интелект действително реконструира текст от откритите остатъци от мастило във влакната на свитъците.

Технологията далеч не е съвършена, но нейните възможности обещават да добавят много към знанията ни за миналото. Тя може да бъде приложена и за разчитане на текстовете на папирусите, в които са били увити мумиите. Във всеки приличен музей има купища от тези папируси, които са съкровищница на информация за живота преди хиляди години.

Leave a Reply

Your email address will not be published. Required fields are marked *