您当前的位置:首页 资讯中心 行业资讯

5G新(xīn)通话不简单,除了5G还集成了这些“黑科(kē)技”!

发布时间:2022-04-18 阅读量:538

4月12日,中國(guó)移动在首钢园國(guó)家冬季训练中心速滑馆举办“5G新(xīn)通话,预见新(xīn)未来”产品发布会,正式发布5G新(xīn)通话产品,并宣布部分(fēn)终端已在全國(guó)支持5G VoNR超清通话业務(wù),打造可(kě)视化、多(duō)媒體(tǐ)、高感知、全交互的全新(xīn)媒體(tǐ)。

5G新(xīn)通话可(kě)以让通话双方实现语音转文(wén)字,同时还可(kě)以在屏幕上实时翻译,让通话人在听见的同时,“看懂”通话的内容。看似好理(lǐ)解的技术,背后蕴藏的大量“黑科(kē)技”,例如语音识别、口语理(lǐ)解、语音同传等等,非深厚的AI语音技术积累不可(kě)為(wèi)。

这些背后的“黑科(kē)技”,主要来自智能(néng)语音和人工智能(néng)的头部企业科(kē)大讯飞,因此,科(kē)大讯飞也成為(wèi)了中國(guó)移动5G新(xīn)通话的官方合作伙伴。

5G“杀手级应用(yòng)”,今年7月后覆盖所有(yǒu)新(xīn)上机型

在发布会上,中國(guó)移动市场经营部总经理(lǐ)首建國(guó)介绍,与互联网的语音视频通话相比,5G新(xīn)通话能(néng)够基于中國(guó)移动5G网络,实现高清视频通话,通话质量稳定,几乎没有(yǒu)时延,且電(diàn)话呼入不中断。同时,结合AI技术,5G新(xīn)通话可(kě)以在通话过程中实现中英文(wén)实时翻译、语音转文(wén)字等功能(néng),此外还提供了屏幕共享、遠(yuǎn)程协作等特色功能(néng)。首建國(guó)还介绍说,目前5G新(xīn)通话功能(néng)正陆续在各大手机终端进行适配,到今年7月,所有(yǒu)终端新(xīn)推出机型都将支持5G新(xīn)通话。

从5G新(xīn)通话所展示的功能(néng)来看,有(yǒu)望成為(wèi)一款“5G杀手级应用(yòng)”。在这一被业界普遍看好的业務(wù)背后,5G网络是核心基础,媒體(tǐ)互动是重要功能(néng)扩展,终端支持是保障,其中还有(yǒu)一个关键,就是AI智能(néng)语音技术。

不仅听见,还能(néng)看懂

科(kē)大讯飞是北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商(shāng)。

资料显示,面向冬奥会场景的多(duō)语种语音及语言服務(wù)平台,采用(yòng)了科(kē)大讯飞的“自动语音转换与翻译”技术,支持60个语种语音合成、69个语种语音识别、168个语种机器翻译和6个语种交互理(lǐ)解,其中重点语种翻译准确率达到了95%,平均每句翻译响应时间不超过0.5秒(miǎo)。

口语化的流畅體(tǐ)验

通话场景下有(yǒu)大量的口语化表达,口语化表达不同于规范的书面文(wén)本,一般表现為(wèi)内容表述不符合语法规范、语气词过重、重复冗余等,这使得直译时出现明显的“机翻”痕迹,给机器翻译在通话场景中的应用(yòng)提出了更高的挑战。

科(kē)大讯飞的技术负责人介绍,针对5G新(xīn)通话口语化场景优化,采取了三大措施:一是人机协同标注常用(yòng)口语数据,并补充口语双语训练;二是系统性运用(yòng)了无监督/弱监督训练方法,基于大量口语化表达的源、目标语言单语数据,采用(yòng)自训练、回译算法等强化翻译模型和语言模型,对口语化表达特性实现增强训练;三是针对语音识别后处理(lǐ)阶段,设计语气词顺滑、规整等模块,将口语化表达尽可(kě)能(néng)书面化,从而减少机翻“痕迹”,帮助用(yòng)户更好地理(lǐ)解。

冠军的底气

中國(guó)移动5G新(xīn)通话背后的人工智能(néng)技术,来源于科(kē)大讯飞23年来坚持源头技术自主创新(xīn)的深厚积累,科(kē)大讯飞在人工智能(néng)语音识别、机器翻译、语义理(lǐ)解等技术领域处于國(guó)际领先地位,在诸多(duō)國(guó)际技术赛事中取得冠军。

在语音识别领域,科(kē)大讯飞参加了2021年OpenASR國(guó)际低资源多(duō)语种语音识别挑战赛15个语种受限赛道和7个语种非受限赛道,全部取得第一;在机器翻译领域,先后获得了2018年IWSLT國(guó)际口语机器翻译评测比赛端到端任務(wù)第一和2021年IWSLT國(guó)际口语机器翻译评测比赛英德语音同传、文(wén)本同传和英日文(wén)本同传全部三个同传赛道冠军;在多(duō)语言理(lǐ)解领域,获得世界权威多(duō)语言理(lǐ)解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)四项任務(wù)中的三项最好成绩,标志(zhì)着科(kē)大讯飞多(duō)语言理(lǐ)解与跨语言迁移能(néng)力再上新(xīn)台阶。在语义评测领域,在第十六届國(guó)际语义评测SemEval 2022的比赛中,科(kē)大讯飞从30余支参赛队伍中脱颖而出,获得“多(duō)语种新(xīn)闻相似度评测任務(wù)”和“多(duō)语种惯用(yòng)语识别任務(wù)”两项冠军。 

以数智化技术构建美好世界是人类共同的希冀。5G新(xīn)通话只是5G+AI有(yǒu)机融合的一小(xiǎo)步,我们有(yǒu)理(lǐ)由相信,在中國(guó)拥有(yǒu)全球规模最大的5G精品网络,拥有(yǒu)世界领先的人工智能(néng)自主核心技术,科(kē)大讯飞和中國(guó)移动这样深度协同的模式,将会让5G+AI发挥更大的融合倍增效应,必将加速推进科(kē)技创新(xīn)、推动数智化转型,共创人工智能(néng)美好新(xīn)世界。