一座被火山灰掩埋数千年未曾问世的图书馆,数百个已然碳化、灰白、极其脆弱的古代文学卷轴,深藏着古老情怀与文明智慧结晶。面向那不勒斯湾,位于意大利南部坎帕尼亚大区的赫库兰尼姆城,与庞贝古城同是公元79年维苏威火山爆发时的牺牲品,在23米深的火山岩屑下,是无数考古学家的向往。

现代科技为他们束手无策的问题给出了新尝试。2023年,在目标为复原赫库兰尼姆纸莎草纸的“维苏威火山挑战赛”中,3名学生完成了一项看似不可能的任务——通过人工智能(AI)技术,以“虚拟开箱”的方式,展开了无法被现实打开的卷轴,恢复了4个140个字符的文字段落。

这3名学生如何成功“复活”这座古老的图书馆?AI在其中怎样发挥作用?现代科技又将为古代文明的发掘带来什么?南都、N视频记者采访了完成了这项“不可能任务”的参赛学生、赛事评审团考古学专家等。他们提到,现代世界面临着各种问题,人类若想能明智地面对未来,就必须从历史中学习汲取新的知识。

打开网易新闻 查看精彩图片

被维苏威火山掩埋的贵族别墅复原图。

AI破解两千年前古卷

去年3月,美国肯塔基大学电脑科学家布伦特·西尔斯(Brent Seales)等人发起一项挑战,名为“维苏威火山挑战赛”,鼓励大家利用AI电脑技术,破解一个在公元79年完成,但后来被火山灰几乎烧毁的古卷。

同年,由三名计算机专业的学生组成的团队,利用AI技术解密了古老卷轴中的2000个希腊文字,在比赛中赢得70万美元大奖。

“我们花了将近一年的时间破解古籍中的内容,这不是一个轻松的过程。”团队中的成员优素福·纳德尔(Youssef Nader)目前是德国柏林自由大学机器学习专业博士生,他告诉南都记者,他利用计算机算法开发了一个墨水检测模型,但AI墨水侦测模型并不基于希腊字母、光学字元辨识或语言模型,也不会直接识别出卷轴上的文字。

相反,它们只需独立地检测CT扫描中的微小墨点,并输出“有墨点”或“无墨点”的结果,当墨点聚集在一起后,就会拼凑出文字。因此,AI识别出的文字并不是机器学习模型“想像”出来的,而是直接与CT扫描中的基础资料相关联。

打开网易新闻 查看精彩图片

柏林自由大学机器学习专业博士生优素福·纳德尔。

纳德尔是埃及人,他告诉南都记者,当他读到“维苏威火山挑战赛”的新闻时,“纸莎草纸”这个词引起了他的兴趣——纸莎草纸是古埃及人民发明,用于书写和绘画的纸张,其使用历史可追溯至公元前3000年,承载了数千年古埃及文明。“作为埃及人,我应该去了解更多的历史,所以我参加了比赛。”

在参加“维苏威挑战赛”之前,他和团队中的其他两名成员——来自美国的卢克·法里托(Luke Farritor)和来自瑞士的朱利安·希利格(Julian Schilliger)并不相识。但他们三位都是“维苏威火山挑战赛”的老将。

去年10月,年仅21岁的法里托作为美国内布拉斯加大学林肯分校电脑科学专业学生,通过开发解析裂纹图案的算法,成功提取出了古卷轴中的第一个希腊单词“πορφúραc”,即“紫色”。随后,纳德尔凭借更清晰的文字影像赢得第二名。

为了加快破解速度,在2023年12月31日挑战赛截止日期前破解卷轴中的更多内容,法里托和纳德尔决定组团工作。此后不久,希利格也加入了团队,他擅长从卷轴中提取出页面,从而提供更多数据用于AI分析。

最终,在挑战赛截止前,三人成功破解了卷轴上超过2000个希腊字母,展示了卷轴15列文本中的数百个单词,相当于卷轴5%左右的内容量。根据目前解读出的内容,卷轴中的文本讨论了我们今天仍然在热议的话题:音乐、食物和快乐。

“我很享受合作的过程,也会继续参加接下来的挑战!”纳德尔表示。

希望的起点

对于美国艺术与科学院院士、密歇根大学古典学教授理查德·扬科(Richard Janko)来说,他的“维苏威火山挑战”从将近40年前就开始了。

“赫库兰尼姆纸莎草纸中有多少未发表的材料啊!我特别渴望在其中找到古代地中海世界最伟大的思想家亚里士多德失传著作的片段。”扬科向南都记者回忆道,1985年,当他开始研究这个课题时,从未想象过有一天有可能能够阅读那些从未被打开过的卷轴。

打开网易新闻 查看精彩图片

美国艺术与科学院院士、密歇根大学古典学教授理查德·扬科。

在接下来近28年的时间里,他在没有借助AI工具的情况下,凭借已有的研究方法,仅重建了其中四卷卷轴。“实际上,在1754年,人们一共发现了约800个卷轴,但其中270个卷轴的纸张已经太过脆弱易碎,即使用当时的原始方法也无法打开。”扬科解释道。

一座被火山灰掩埋数千年未曾问世的图书馆,一座无法被探寻解密、却又深藏着古老情怀与智慧结晶的文明宝库,数百个已然碳化、灰白、极其脆弱的古代文学卷轴……无数科学家为此深深着迷。

很快,不再仅有历史学家关注到这个课题。扬科告诉南都记者,他第一次收到肯塔基大学计算机科学家布伦特·西尔斯的邮件,是在2005年。

“因为我所在的密歇根大学拥有西半球最大的古代和中世纪希腊手稿收藏。西尔斯向我询问,是否可以扫描密歇根大学保存的资料。”扬科说,西尔斯向他证明了,能够通过技术手段读取其中无法打开的卷轴表面文字,但前提是书写文字的墨水中含有铁。

但不幸的是,赫库兰尼姆纸莎草纸的抄写员使用了另一种基于碳的墨水,这与纸莎草纸的成分相同,所以通过上述方法无法分辨墨水的痕迹。即便如此,西尔斯在坚持了10年后,终于在2019年证明了可以通过机器学习训练计算机视觉,并利用X射线断层扫描来识别墨水。

打开网易新闻 查看精彩图片

难以被展开的纸莎草纸卷轴。

但他们依旧需要开发软件、通过机器重建展开卷轴的表面。扬科向南都记者解释道,虽然西尔斯所发明的软件有望实现这一目标,但难度依旧很大。火山灰让卷轴被压碎了,严重变形,就像被烧焦的报纸一样脆弱、扭曲、破损。

他们需要更高明的技术、更充足的人员和来自不同学科的人类智慧。这就是为何2023年3月,伴随着投资者的加入,西尔斯在前述研究的基础上,建立起了“维苏威火山挑战赛”。第一个阅读卷轴的人能获得100万美元奖金。扬科也受邀加入了挑战赛的评审团。

从千年的火山灰烬中复活一座古老的图书馆,这一看似不可能被实现的任务,通过超级科技和古老文明的碰撞成为现实。270余年后,三位学生开启了一个希望的起点。

但对秘密的探索这才刚刚开始,2024年,挑战赛的目标是:在曾经通过AI技术成功阅读了数段文字的基础上,阅读整个卷轴。

更多古代文明有望破译

“人工智能带来了一个宝贵的可能性,让那些仅靠人类智慧无法解决的问题与希望相遇,”同为“维苏威火山挑战赛”评审团一员的意大利那不勒斯费德里科二世大学古典学教授费德莉卡·尼古拉迪(Federica Nicolardi)向南都记者描述道,“从这个角度来看,AI将为考古学带来一场全新的革命。”

打开网易新闻 查看精彩图片

那不勒斯费德里科二世大学古典学教授费德莉卡·尼古拉迪。

她告诉南都记者,赫库兰尼姆的这座别墅图书馆因为被火山掩埋,它所保存的希腊语和拉丁语书籍没有通过任何其他途径得到流传。这些书籍几乎完全与公元前4至3世纪的伊壁鸠鲁创立的希腊化哲学“伊壁鸠鲁主义”有关。

“通过AI技术对这些卷轴、书籍进行展开,是完全‘非侵入性’的行为,它不会对实际文本带来无法弥补的损坏,又提供了一个独特机会,让我们得以阅读可追溯至公元前3世纪至公元1世纪的全新文本。”尼古拉迪表示。

扬科对此还有新的展望。他告诉南都记者,“维苏威火山挑战赛”中针对的这所别墅属于一位极有权势的贵族,他曾是凯撒大帝的岳父。按照这些古代贵族的习惯,在人们所发现的小型图书馆之外,一定还有一个更核心、更大的图书馆,里面装满了涵盖各个学科的著作。

“既然我们已经能够在不损坏卷轴的情况下,阅读这些书籍。那么我们就应该尝试挖掘整个别墅,寻找所有遗失的知识。火山很容易再度喷发,永远埋葬这一切文明。”扬科说。

AI技术带来的是希望,无数的卷轴等待它的发现、恢复和阅读。

“我相信,有许多丢失的书籍还静静地躺在沉底于黑海的船只中,被完好无损地保存下来。一定也还有中国古代的卷轴,也因为纸张脆弱而无法被打开。那些曾经被镌刻在石头上的古希腊和罗马铭文通常已经经历了时间的磨损,泥板上的巴比伦楔形文字也是如此。”扬科向南都记者历数那些同样有望重见天日的文明。

扬科解释道,光学字符识别(OCR)技术第一次出现时,它通过光学技术确定纸上的文字形状,然后人们通过训练其字符识别方法,将这些形状翻译成计算机文字。“如果软件开发人员仅仅关注将其应用在我们日常可见的书写形式上,那就是在损害考古学的进步。”

与此同时,扬科还提出了AI技术在考古学中的一些新作用。它可以被用来重建古代遗址的模型,让人们通过虚拟现实的方式来体验、进入、欣赏这些古老的建筑。它还有助于帮助考古学家从三维的角度来学习和解释考古发掘的地层学。

尼古拉迪也指出,“维苏威火山挑战赛”开发的虚拟技术可以被应用于不同的材料上,例如损坏的手稿、覆盖木乃伊的纸莎草纸等。她向南都记者介绍道,目前,人文学科中,还有其他已经在进行中的、使用AI技术的项目,例如重建破碎的雕像或花瓶,以及恢复因时间而零碎的题词文本。

“然而,我们依旧应该保持警惕,仔细验证结果的准确性,将AI可能为人类带来成功幻象的风险降至最低。这非常重要。”尼古拉迪告诉南都记者。

出品:南都即时

采写:见习记者 肖玥 南都记者 杨苓妍