研究人员开发了古代楔形文字板的自动文本识别
一种新的人工智能(AI)软件现在能够破译楔形文字平板电脑上难以阅读的文本。它是由马丁路德大学哈勒维滕贝格分校 (MLU)、约翰内斯古腾堡大学美因茨分校和美因茨应用科学大学的团队开发的。AI 系统使用平板电脑的 3D 模型而不是照片,提供比以前的方法更可靠的结果。这使得搜索多个平板电脑的内容并相互比较成为可能。它还为全新的研究问题铺平了道路。
在他们的新方法中,研究人员使用了近 2,000 块楔形文字板的 3D 模型,其中大约 50 块来自 MLU 收藏的。据估计,全球仍有约一百万台此类平板电脑存在。其中许多已有 5000 多年的历史,是人类现存最古老的书面记录之一。它们涵盖了极其广泛的主题:“一切都可以在上面找到:从购物清单到法庭裁决。这些石板让我们得以一睹人类几千年前的过去。然而,它们已经风化严重,因此即使是受过训练的人也很难破译。”眼睛”,MLU 助理教授休伯特·马拉 (Hubert Mara) 说道。
这是因为楔形文字板是未烧制的粘土块,上面已压有文字。更复杂的是,当时的书写系统非常复杂并且包含多种语言。因此,正确识别符号不仅需要最佳的照明条件,还需要大量的背景知识。“到目前为止,同时访问许多楔形文字板的内容一直很困难 - 你需要确切地知道你在寻找什么以及在哪里,”玛拉补充道。
他的实验室提出了开发基于 3D 模型的人工智能系统的想法。新系统比以前的方法更好地破译字符。原则上,人工智能系统的工作原理与 OCR 软件(光学字符识别)相同,后者将书写和文本的图像转换为机器可读的文本。这有很多优点。一旦转换成计算机文本,文字就可以更容易地阅读或搜索。“OCR 通常适用于照片或扫描件。对于纸上或羊皮纸上的墨水来说,这没有问题。然而,对于楔形文字板来说,事情就更困难了,因为光线和视角极大地影响了某些字符的识别效果, ”MLU 的 Ernst Stötzner 解释道。他开发了新的人工智能系统,作为休伯特·马拉 (Hubert Mara) 指导下的硕士论文的一部分。
该团队使用三维扫描和附加数据来训练新的人工智能软件。其中大部分数据由美因茨应用科学大学提供,该大学正在监督一个大型粘土片 3D 模型项目。人工智能系统随后确实成功地可靠地识别了平板电脑上的符号。“我们惊讶地发现我们的系统甚至可以很好地处理照片,而照片实际上是较差的源材料,”斯托茨纳说。
哈雷和美因茨研究人员的工作为迄今为止相对独特的材料提供了新的途径,并开辟了许多新的研究方向。到目前为止,它只是一个能够可靠地识别两种语言符号的原型。然而,已知总共存在十二种楔形文字。未来,该软件还可以帮助破译风化的铭文,例如墓地中的铭文,这些铭文就像楔形文字一样是三维的。
科学家们已经在几个国际知名会议上展示了他们的工作,最近一次是在国际计算机视觉会议上。几周前,该团队在图形与文化遗产大会上获得了“最佳论文奖”。
版权声明:本文由用户上传,如有侵权请联系删除!