您的当前位置:首页>科技快讯 > 正文

5G新通话不简单:不仅听见,还能看懂

  • 2022-04-15 20:00:30 来源:科技日报

科技日报记者 吴长锋

4月12日,中国移动在首钢园国家冬季训练中心速滑馆举办“5G新通话,预见新未来”产品发布会,正式发布5G新通话产品,并宣布部分终端已在全国支持5G VoNR超清通话业务,打造可视化、多媒体、高感知、全交互的全新媒体。

将覆盖所有新上机型

在发布会上,中国移动市场经营部总经理首建国介绍,与互联网的语音视频通话相比,5G新通话能够基于中国移动5G网络,实现高清视频通话,通话质量稳定,几乎没有时延,且电话呼入不中断。同时,结合AI技术,5G新通话可以在通话过程中实现中英文实时翻译、语音转文字等功能,此外还提供了屏幕共享、远程协作等特色功能。首建国还介绍说,目前5G新通话功能正陆续在各大手机终端进行适配,到今年7月,所有终端新推出的机型都将支持5G新通话。

从5G新通话所展示的功能来看,有望成为一款“5G杀手级应用”。在这一被业界普遍看好的业务背后,5G网络是核心基础,媒体互动是重要功能扩展,终端支持是保障,其中还有一个关键,就是AI智能语音技术。

不仅听见,还能看懂

5G新通话可以让通话双方实现语音转文字,同时还可以在屏幕上实时翻译,让通话人在听见的同时,“看懂”通话的内容。看似好理解的技术,背后蕴藏着大量黑科技,例如语音识别、口语理解、语音同传等等,非深厚的AI语音技术积累不可为。

这些背后的黑科技,主要来自智能语音和人工智能的头部企业科大讯飞,因此,科大讯飞也成为中国移动5G新通话的官方合作伙伴。

据悉,科大讯飞是北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商。资料显示,面向冬奥会场景的多语种语音及语言服务平台,采用了科大讯飞的“自动语音转换与翻译”技术,支持60个语种语音合成、69个语种语音识别、168个语种机器翻译和6个语种交互理解,其中重点语种翻译准确率达到了95%,平均每句翻译响应时间不超过0.5秒。

口语化体验更流畅

通话场景下有大量的口语化表达,口语化表达不同于规范的书面文本,一般表现为内容表述不符合语法规范、语气词过重、重复冗余等,这使得直译时出现明显的“机翻”痕迹,给机器翻译在通话场景中的应用提出了更高的要求。

科大讯飞的技术负责人介绍,针对5G新通话口语化场景优化,采取了三大措施:一是人机协同标注常用口语数据,并补充口语双语训练;二是系统性运用了无监督/弱监督训练方法,基于大量口语化表达的源、目标语言单语数据,采用自训练、回译算法等强化翻译模型和语言模型,对口语化表达特性实现增强训练;三是针对语音识别后处理阶段,设计语气词顺滑、规整等模块,将口语化表达尽可能书面化,从而减少机翻“痕迹”,帮助用户更好地理解。

中国移动5G新通话背后的人工智能技术,来源于科大讯飞23年来坚持源头技术自主创新的深厚积累。科大讯飞在人工智能语音识别、机器翻译、语义理解等技术领域处于国际领先地位,曾在诸多国际技术赛事中获得冠军。

(科大讯飞供图)

标签:

推荐阅读

5G新通话不简单:不仅听见,还能看懂

4月12日,中国移动在首钢园国家冬季训练中心速滑馆举办“5G新通话,预见新未来”产品发布会,正式发布5G...

广西海警保护“海洋精灵”布氏鲸,还海洋一片干净的环境

保护生物多样性作为一项国家战略,对建设美丽中国具有至关重要的意义。4月13日上午10时左右,广西北海海...

纳米限域金属离子/质子双向快速整流传输机制揭示

记者从中国科学技术大学获悉,该校工程科学学院吴恒安教授研究团队与澳大利亚蒙纳士大学化学与生物工程...

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

业界