借助深度学习揭秘:印度河流域文明古代文字的数字化之旅|TodayAI

人工智能新闻4个月前更新 TodayAI
1,175 0 0
PonderAI-智能助手

借助深度学习揭秘:印度河流域文明古代文字的数字化之旅|TodayAI

印度河流域文明,与美索不达米亚和埃及并称为世界历史上最早的三大文明之一,始于公元前3300年,地域跨越现今的巴基斯坦和印度。这一文明以其统一的度量衡、熟练的工匠、多元的贸易商业系统以及超过500个用于交流的符号和标志而著称。

然而,一个问题长期困扰着学者们,阻碍了对这一文明进一步的了解:这些字符究竟是一种语言,还是类似于象形图的符号?尽管一些专家已开始尝试翻译在印度河流域铭文中发现的自右向左的文字,但对此仍然没有普遍的共识。

“这一争论尚未解决,”计算机科学教授Debasis Mitra表示。他因获得国家人文基金会颁发的一项创新资助——使用深度学习对印度河流域遗物进行古代文字数字化和归档(ASDA)——而参与到这一探索中。

研究生助理Deva Atturu将在四月份答辩其硕士论文,他正在协助Mitra进行这项资助研究。本月,他们通过网络参加了在芝加哥大学举行的2024年南亚考古会议,并在会上介绍了他们的工作。

他们正在研究的文字可能是一系列符号,如等同于美元符号和商业交易图像的符号,或者这些符号可能是字素,即表示语音的单个字母或字母组。

Mitra并不打算解决这一争论,而是希望通过开发一种机器学习算法来识别和数字化印度河流域文明的古代文字,为那些将要解决这一问题的人提供帮助。目前缺乏数字化数据,这是Mitra希望解决的问题。

这一过程使用自动化脚本识别系统(ASR)从1000多张印度河印章的照片数据集中提取图形的编码序列。通过两级人工神经网络,ASR成功检测图形的准确率达到了88%。

尽管如此,这个过程仍然充满挑战。通常,通过输入大量数据来训练系统,从而赋能机器学习。然而,在这种情况下,可输入的数据并不多,而且现有的数据有时可能会受到干扰或扭曲。

Mitra将不同的机器学习元素应用到项目中,试图生成新数据或寻找可能更有效的其他方法。他还经常参加计算机科学家通常不会出席的会议,如去年在密尔沃基威斯康星大学举行的南亚年会,他在此介绍了这一机器学习项目。

通过参加这些会议,他可以与考古学家保持联系,后者可以为他提供更多数据。”我去这些会议并试图与他们交谈,”他说。

他还邀请了印度统计学院的学生们参与其中。他们一起取得了进展。他们能够数字化一些图案和字素,并根据数据量,甚至创建一种文字。将其数字化并存入数据库是初始资金支持的目标。

下一阶段?创建一个系统,允许现场的考古学家用智能手机拍摄文本或符号的照片,并将其传送到数据库中进行数字化。

Mitra表示,这些努力旨在帮助阐明并更好地理解他国家的伟大文明,这为他提供了额外的动力。

“这是我的历史的一部分,所以有额外的动力。显然,我看到印度学生也因为同样的原因非常感兴趣,”他说。”但最初的几次突破是由一对对印度情有独钟的美国学生完成的,他们中的一些人表示他们后来访问了印度。”

© 版权声明

相关文章