Rękopisy płoną i dają się odczytać

Dzięki specjalnie opracowanej technologii, wykorzystującej również sztuczną inteligencję, prawdopodobnie uda się odczytać antyczne, spalone papirusy z miasta Herkulanum, zniszczone wybuchem wulkanu sprzed ok 2000 lat. Pierwsze słowo ze spalonego zwoju zostało niedawno odczytane – informacja pochodzi z początku października 2023. Autorem sukcesu był 21 letni student z USA, który wytrenował sieć neuronową tak, by ze zniszczonego papirusu odczytała słowo „porfyras”, co po grecku znaczy purpura.

Źródło: Bing Image Creator

W marcu 2023 ogłoszony został konkurs dla ludzi albo zespołów tworzących czy trenujących algorytmy sztucznej inteligencji. Można wygrać szereg nagród, w tym najwyższą wysokości 1 miliona $, jeśli sztucznej inteligencji pod kierownictwem ludzi uda się odczytać słowa, linijki tekstów lub całe zwoje. Student z USA otrzymał jedną z mniejszych nagród – 40 tysięcy dolarów. Niektóre zwoje wyglądają tak:

W roku 79 naszej ery, wulkan Wezuwiusz wybuchł z ogromną mocą i zniszczył wiele rzymskich osad i miast, w tym Pompeje oraz Herkulanum. Pierwsze, systematyczne wykopaliska w Herkulanum ruszyły już ok 300 lat temu a w jednym z budynków, zwanym odtąd Willą Papirusów, zostało znalezionych ok 2 tysięcy antycznych, zwęglonych, stwardniałych papirusów, czyli rolek zapisanego materiału, podobnego do grubego papieru. Przetrwały stulecia, gdyż do ich zwęglenia doszło relatywnie szybko i bez dostępu tlenu a następnie zostały przysypane i sprasowane.

Od XVIII wieku aż do naszych czasów kolejne zespoły naukowe próbowały przemyślnymi maszynami powoli rozwijać spalone papirusy, namaczać je w różnych roztworach. Jednak nawet jeśli udawało się je rozwinąć i coś odczytać, to potem papirusy rozpadały się na fragmenty. W ostatnich 10 latach powstała jednak zaawansowana, wieloelementowa technologia używająca m.in promieni rentgenowskich, obrazowania komputerowego oraz maszynowego uczenia i sieci neuronowych. Mikrotomografia komputerowa, połączona z analizą obrazu pozwalają na wirtualne rozwinięcie zwojów i odczytanie zatartych tekstów, zniekształconych przez spalanie i inne procesy.

Jednym z pionierów tej technologii jest Amerykanin, dr Brent Seales (WB Seales). Zaczął zajmować się problematyką zabytkowych dokumentów, gdy w połowie lat 90-ych XX wieku pracował w zespole digitalizującym około 1000 letni manuskrypt poematu Beowulf. Potem Seales zajął się innymi problemami, ale pracując na styku medycyny oraz informatyki odkrył, że technologie właśnie rodem z medycyny, połączone z informatycznymi mogą przydać się w analizie zabytkowych dokumentów.

Zanim Seales zainteresował się zwojami z Herkulanum był w zespole, który z sukcesem wirtualnie odwinął znaleziony w Izraelu słynny zwój z En Gedi. Biorąc pod uwagę, w jakim stanie znajduje się ten zabytek, to wręcz niewiarygodne, że udało się zwój wirtualnie odwinąć w 2015 roku.

Źródło: Wkipedia.org za Israel Antiquities Authority רשות העתיקות של ישראל / Aut. Israel Antiquities Authority שי הלוי / CC BY-SA 3.0 DEED

Skanowanie zwoju pozwoliło zobaczyć jego zbite warsty oraz stworzyć ich obrazy które następnie zostały „wyprostowane”. Tam, gdzie ocalał materiał i widoczny był tekst został bez większych problemów odczytany. Zwój z En Gedi był napisany innym, lepiej zachowanym atramentem niż zwoje z Herkulanum. Na nich udało się zidentyfikować poszczególne warstwy lecz atrament jest bardzo trudny do odczytania. Do tego potrzeba innej technologii sieci neuronowych oraz tzw. sztucznej inteligencji. Jak kolejne przełomy technologiczne pozwoliły na odczytanie obrazów, które do tej pory uznawane były za nieczytelne?

Próby odczytania trwają od kilku lat. Technologia wygląda tak, że sieć neuronowa najpierw uczy się znaków i liter na papirusach lepszej jakości. Potem stopniowo dostaje papirusy czy obrazowania gorszej jakości, w tym zdjęcia rentgenowskie. Potem dostaje obrazowania warstw najgorzej zachowanych. W ten sposób sieć neuronowa ucząc się, w pewnym sensie wchodzi na coraz głębszą wodę a jednocześnie testuje w procesach obliczeniowych najbardziej wydajne strategie odczytywania obrazów. Poniżej możemy zobaczyć, jak to wyglądało.

Na dole ilustracja z pracy naukowej z 2019 roku. Obraz A to materiał, na którym sieć uczyła się rozpoznawania litery C – świetnie widoczna litera z jakiegoś innego, dobrze zachowanego papirusu. Obraz B to faktyczne zdjęcie fragmentu spalonego papirusu z Herkulanum, gdzie gołym okiem nie da się nic zobaczyć. Obraz C to próba przefiltrowania obrazu przez zestaw filtrów. Obraz D to ostateczna wersja, uzyskana przez sieć neuronową po użyciu wszystkich warstw i filtrów – widoczna litera C.

Źródło: Parker CS, Parsons S, Bandy J, Chapman C, Coppens F, Seales WB (2019) From invisibility to readability: Recovering the ink of Herculaneum. PLoS ONE 14(5): e0215775. https://doi.org/10.1371/journal.pone.0215775 / CC BY 4.0 DEED

Tak działają wyspecjalizowane sieci służące do analizy obrazów – nazywające się po angielsku Convolutional Neural Networks (CNN). Im więcej warstw takiej sieci, tym więcej różnych operacji jest dokonywanych, co z ludzkiego punktu widzenia jest sprawdzeniem, czy dany rodzaj spojrzenia lub filtrowania obrazu, dostrzeże i podkreśli spójny zestaw cech. Ten typ obliczeń czy przekształceń wartości kodujących obraz w matematyce nazywany jest splotem lub konwolucją.

Dr Seales postanowił wraz z grupą fundatorów ogłosić konkurs pod nazwą „Vesuvius Challenge”. Jego celem było skłonić ludzi do zajęcia się problemem odczytania zwojów i odczytać więcej. Porównajmy to do sytuacji, gdzie grupa ludzi miałaby przyjrzeć się wielkiemu, nieczytelnemu obrazowi i w związku z tym dzieli się zadaniami. Ty patrzysz na lewy, górny róg a kto inny patrzy na środek, a jeszcze kto inny tylko na lewo, na dole. Co więcej, do tego patrzenia zakładamy różne rodzaje okularów, bo jedne szkła wydobywają kolory a inne wyostrzają kontrast.

Jeden z uczestników konkursu, 21 letni Luke Farritor, student z Nebraski nauczył sieć neuronową odczytywania wybranych fragmentów papirusów – w tych miejscach atrament wyglądał, jak pęknięcia spalonego materiału. Dzień później kolejny z uczestników konkursu, podążający tym samym tropem odczytał to samo słowo “πορφύραc”, w tym samym miejscu.

W wywiadzie sprzed ponad pół roku dr Seales mówił, że jest na 90% pewien, że uda się odczytać spalone zwoje z Herkulanum. Jeśli tak się faktycznie stanie, to nie tylko z powodu użycia technologii sztucznej inteligencji. Samo zastosowanie sztucznej inteligencji jest możliwe dzięki dwóm dekadom prac badawczych, polegających na skanowaniu, digitializowaniu, opisywaniu i analizie fragmentów papirusów, spoczywających w muzeum w Neapolu. Jednak to zbiorowy wysiłek ludzi tej używających sztucznej inteligencji być może doprowadzi do przełomu i odczytania zwojów, które ostatni raz były czytane około 2 tysięcy lat temu zanim wybuchł wulkan.