您的当前位置:首页>创新 > 正文

北京大学携手字节跳动推动中华古籍数字化平台建设

  • 2022-03-18 14:45:58 来源:中国科普网

中国古籍一直面临数字化程度低、以文本形式进行数字化的古籍数量少、难以检索等问题。数据显示,我国现存古籍有20万种,据不完全统计,其中有数字化扫描影像的已经有8万种,而实现文本数字化的仅有3-4万种左右。这对于古籍内容检索和开展研究造成了不便。

3月17日,字节跳动向北大教育基金会提供捐赠,全面支持“北京大学-字节跳动数字人文开放实验室”的工作,研发古籍数字化平台,利用智能技术加速中华古籍资源的数字化建设,向全社会提供公益化服务。

据了解,该实验室将调动国内外的相关力量,在三年内完成一万种精选古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录。提供开放、体验良好的阅读服务和基本文本库,并借助知识图谱等技术帮助学者高效检索和利用古籍中的信息。

同时,项目也将推出结合OCR、句读、实体识别和知识图谱等技术构建的一站式自动古籍智能化整理平台,并对社会大众免费开放,便于收藏机构、研究者、相关专业的师生和广大古籍爱好者自行完成古籍数字化工作,加快整个行业数字化古籍资料的效率。

“北京大学-字节跳动数字人文开放实验室”重视传承中华传统文化,希望将平台建设成为开放、共享、可对古籍进行充分检索利用的信息平台,以应对这些古籍保护与利用中的挑战。

字节跳动AI Lab总监李航表示:“我们希望通过公益捐赠,支持北大的古籍数字化成果全面转化为社会服务。我们也希望与北大的跨学科团队在OCR、自然语言处理、知识图谱等技术领域展开全面合作,充分利用人工智能技术加快古籍数字化整理、研究、与利用,让更多的研究者、爱好者以更高效、便利的方式获取古籍里蕴藏的丰富知识。”

标签: 古籍数字化 北京大学 据不完全统计

推荐阅读

北京大学携手字节跳动推动中华古籍数字化平台建设

中国古籍一直面临数字化程度低、以文本形式进行数字化的古籍数量少、难以检索等问题。数据显示,我国现...

蓝黄橙红,这些气象预警信号颜色怎么看?

中国科普网讯(记者胡利娟)生活中,我们经常能在手机里、电视中看到颜色不一的气象灾害预警信号,相信...

张文宏解读最新《诊疗方案》:应对抗疫更从容

3月15日夜,国家卫健委发布《新型冠状病毒肺炎诊疗方案(试行第九版)》(以下简称《方案》),引发公众...

中国第93个国医节:中医大师谈国医

3月17日,是中国第93个国医节。中医过时了吗?如何认识国医节?科普时报特此采访了张伯礼、廖品正、刘敏...

云南发现极度濒危吊灯花属新种

科技日报讯(记者赵汉斌)位于滇中的绿汁江属红河水系,是元江右岸一级支流。不久前,中国科学院西双版...

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

业界