您的当前位置：首页>资讯 > 正文

AI破解古文字登Nature封面：修复缺失文字精确地理位置和书写时间

2022-03-10 13:23:40 来源：凤凰网

原标题：AI破解古文字登Nature封面：修复缺失文字，精确地理位置和书写时间，DeepMind&哈佛&谷歌多家联手开发

最新一期的Nature封面，AI再度来到舞台中央，这一次是在破译古文字方面立功了。

这是一种基于Transformer架构的方法，由DeepMind、谷歌、牛津大学等多家研究机构联合开发。

在单独修复受损文本时，这种方法能达到62%的准确率。

在实际应用中，历史学家单独破译某块古希腊石碑的准确率本来只有25%，但在使用这一方法后一举提升了近乎3倍，达到了72%。

不仅能修复文字，这一方法在地理归属的任务上也有71%的准确率，还能将古文字的书写日期精确到30年以内。

目前，这一方法已经引起了不小的讨论热度：

现在已经有可以在线解析古希腊文字的网页版，架构方法也已开源。

Transformer破译古文字

这是一个叫做Ithaca的架构，以荷马史诗《奥德赛》中的希腊岛屿命名。

Ithaca架构中的注意力机制能够通过串联输入的单个字符、完整单词的表征与顺序位置来了解输入文本的每一部分的位置，最终权衡不同的输入对模型决策过程的影响。

完整架构由多个Transformer块组成，每个Transformer块都输出一个经过处理的表征序列（Sequence of Processed Representations），其长度即输入字符的数量。

其输入随后被传递给三个分别负责文字修复、地理归属、时间归属的任务头，每个头都由一个前馈的神经网络组成，专门负责各自任务的训练。

在文字修复任务中，Ithaca会提供20个按概率排列的解析结果预测：

地理归属的确定上，则会依据古历史学中的84个区域中对输入文本进行分类，将可能的区域预测类别通过地图和柱状图展现：

日期归属任务同样也通过分布预测的柱状图来展示。

如下图所示，公元前300-250年的日期10年一组，被表示为5个概率相同的范围，而公元前305年的铭文将以100%的概率被分配到公元前300-310年的十年组：

历史学家的AI助手

研究人员分别将Ithaca与历史学家、同类AI方法Pythia、以及Ithaca与历史学家合作等不同破解古文字的方法做了对比。

字错率（CER）总是越低越好，在文字修复任务上，Ithaca的字错率和准确率都最好，如果与历史学家合作时，效果还将再次提升。

在论文的最后，研究人员表示，研究方法适用于手稿学、钱币学和纸草学等所有与古代文本相关的学科，也适用于古代、现代的任何语言。

目前，这一方法已经投入了实际使用，比如在雅典时期颁布的某个重要法令的碑文的日期确认上，历史学家们之前认为是在公元前446/5年之前书写的。

而Ithaca与历史学家一起，将这一日期更新到了公元前424/3 年：

Ithaca现在提供了在线试用的途径，登录官网，在方框中中输入古希腊铭文，将缺少的字符标记为破折号（-），将预测的字符标记为问号（?）。

每次查询最多可以预测10个连续或非连续的问号，点击查询后将在下方显示文本缺失的字符，并将其归属到原来的地点和时间：

作者介绍

研究由DeepMind、威尼斯卡福斯卡里大学（Ca’ Foscari University of Venice）、哈佛大学、雅典经商大学 (Athens University of Economics and Business)、谷歌几家AI团队合作开发。

论文有两位共同一作，其中annis Assael为DeepMind的AI部门的研究员，硕博都毕业于牛津大学，同时也是福布斯“30岁以下30名欧洲杰出科学家”之一：

共同一作Thea Sommerschield则是一位历史学家，目前任威尼斯佛斯卡里大学的人文科学院，以及哈佛大学希腊研究中心的研究员，主要研究领域是将机器学习应用于研究古代地中海的书面文化。

标签：历史学家 ithaca

AI破解古文字登Nature封面：修复缺失文字精确地理位置和书写时间

在单独修复受损文本时，这种方法能达到62%的准确率。

国富资本董事长：中国能源利用率提升要思考元宇宙

元宇宙是虚实融合趋势是长期过渡状态

亿欧王彬：元宇宙要为国家数字经济发展贡献

专家预测到2022年，我国数字经济占全国GDP的比重可以达到50%

祝融号最新数据显示：火星地貌有被水侵蚀的迹象

官方表示计划在2030年前实现火星采样返回任务。

国外一公司计划在地球上挖一个迄今最深的洞来获得无尽的可再生能源

地热能源可能会成为与太阳能、风能、水能以及核能并列的清洁能源。

在我国内蒙古宁城县发现1.25亿年前“宁城中华草”

土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏

我国车联网产业发展进入快车道，智能网联汽车数量快速增加

腾讯与奥迪宣布达成战略合作，“微信车载版”上线

“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力

自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持

半导体厂商一季度业绩向好，国产替代进程加速

据预测：2025年，全球卫星网络接入设备将达2亿台套

我国海上风电总装机容量仅次于英国，位居第二

里程碑式突破！揭示高能宇宙线起源之谜

青海省开启“集控站+无人值守”运维新模式提高设备运行水平

安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域达世界先领先水平

加快推进“双千兆”网络建设，聚焦网络质量提升

英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%

2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办

ASO-S“探日”有望于2022年发射升空！探索太阳磁场

超高速互联网将普及计算助力缩小数字鸿沟

1至2月，我国规模以上互联网企业完成业务收入同比增长达29%

数字化转型找准“方向感”，打造国内商业数字化发展高地

加快5G网络规模化部署，打造数字经济新优势

探索5G行业融合应用 5G专网将进一步推动融合应用发展

中国移动香港5G商用一周年开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响

7709米！哈工程“悟空”号创中国AUV潜深新纪录

人工智能领域新算法发布数据传输更高效精准

科技创新技术加持，我国船舶制造已达到世界前列

我国5G网络要坚持适度超前原则，探索5G应用发展

我国汽车自动变速器技术创新按下“快进键” 加速行业转型升级

AMR智能物流机器人，推动汽车行业智慧物流应用和发展

小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?

我国可再生能源技术装备水平大幅提升，开发利用规模稳居世界第一

吉利帝豪S正式开启预售 8.67万元-11.07万元

科技助力智能生活垃圾分类投放点全新亮相

“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布

《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布

第一门户搜索网站雅虎旗下知名问答平台“雅虎问答”将于5月4日关闭

乐视贾跃亭回国有望？FF已提交上市文件

国内首个“5G+北斗”高速公路智能护栏预警系统上线

LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统

新一轮科技革命和产业变革持续演进，提高制造业生产效率

“能联全球”平台正式发布，推动全球能源电力发展合作

网曝拯救者电竞手机2 Pro真机谍照：采用RGB呼吸灯

雷军开启个人第三场直播：小米进军智能电动汽车行业

700MHz 5G网络共建共享落地实施！着重建设5G“黄金频段”

2021年底，5G网络基本实现县级以上区域、部分重点乡镇覆盖

腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价

苹果文档曝光：新一代Apple TV将发布配置大幅升级

智能机器人完成多项智能巡视任务，作业效率提高三倍

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品，均转载自其它媒体，转载目的在于传递更多的信息，并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权，如发现本站文章存在内容、版权或其它问题，烦请联系。联系方式：8 86 239 5@qq.com，我们将及时沟通与处理。

AI破解古文字登Nature封面：修复缺失文字 精确地理位置和书写时间

推荐阅读

猜您喜欢

新闻更多>

资讯

创新

子站

AI破解古文字登Nature封面：修复缺失文字精确地理位置和书写时间