本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>
5G带来了网络的高带宽和低时延,网络算力得到了巨大的提升。5G新通话在此基础上,推动传统音视频通话体验向超清、智能、交互式的方向发展,充分利用网络侧的算力和带宽资源,借助AI技术的辅助,面向行业开放网络能力,为用户提供基于运营商全球互通网络的普适性智能通信体验。
通信网络从软交换时代演进到4G VoLTE时代,在基础话音网络之上提升了视频能力。到了5G时代,算力和带宽得到了进一步提升,通话体验也向更加多元化的沉浸式通话方向发展,支持更丰富的多媒体元素,此即新通话。
新通话以5G网络架构为基础,一方面引入各种形式的多媒体内容;另一方面构筑起端网协同的能力,通过IMS网络的音频和视频通道及新增数据通道(Data Channel),终端与网络之间能够进行任意格式的数据交互,从而实现内容表达的多元化和丰富性。
如图1所示,“1+3+N”新通话网络架构基于1个全融合的IMS基础网络提供音频、视频、数据通道,组成“一网三通道”的网络底座,能够实现超清、智能、交互三大能力,面向个人和行业提供N种差异化创新业务,实现通话体验的跨时代升级。同时,全新升级的新通话网络具备使能千行百业业务创新的开放性,可以为未来丰富的交互场景提供灵活的网络开放能力。
运营商网络区别于OTT网络的专有承载、随时随地可达与QoS保障能力,为新通话音视频和数据业务所需要的高清和低时延能力奠定了基础。同时,话音网向5G新通话网络的持续演进、传统2G/3G网络的平滑退网,也给话音基础网的复杂性、可靠性、稳定性带来了挑战。
华为创新性地提出了Single Voice Core解决方案,基于一张极简高效的融合核心网,实现全用户接入和全业务处理,为2G/3G/4G/5G和固定接入的各种不同类型用户提供实时通话业务。该方案既能使2G/3G平滑退网,又能面向5G平滑演进,并对新通话创新业务开放基础网能力API接口,在极大简化网络的同时,保持了网络架构的高度稳定性和可靠性。
新通话媒体面围绕极速创新、极致性能、极优体验3个方面持续构筑能力,通过新通话媒体引擎集成智能模型以及图形、视频处理算法,实现网络原生的智能深度处理,同时支持GPU/NPU异构硬件加速能力,从而实现超清、智能、交互式的媒体能力创新。
超清:网络侧从原来的纯转发能力升级为“编解码+AI能力”,以完成视频内容处理和视频质量保障。通过网络侧对网络质量更强的感知能力,实现自适应带宽预测算法和自适应带宽调整算法,进而实现更加及时、准确的音视频传输速率调整,提升音视频通话质量。未来,借助AI辅助的编解码和画质增强技术,新通话可以带给用户超越原生VoLTE/VoNR的语音与视频体验。
智能:通过网络侧引入AI能力,为各类终端提供虚拟头像、背景替换、智能翻译等全新体验,实现网络侧一次能力升级,全网用户体验同步升级。同时,将AI算力从端侧卸载至网络侧,可有效降低端侧功耗,网络侧的超强算力能够实现端侧无法实现的复杂AI功能(如高精度的背景分割),再结合量化、蒸馏、剪枝等压缩手段实现网络侧的高并发推理,满足现网大规模用户使用。基于网络侧增强的视频通道,降低对终端的机型、性能要求,打破各垂直应用之间的壁垒,为全球用户提供普适性的智能通信与社交体验。
交互式:新通话网络架构在音视频通道之外,新增了数据通道,终端可以从网络侧自动发现、下载新通话小程序,以Web化界面的形式呈现丰富多样的小程序内容。用户可以在终端新通话小程序界面上进行各种功能设置和页面操作,借助数据通道完成端网协同的数据交互。新通话小程序由网络侧定义,终端可随时下载、更新。小程序架构具有良好的可扩展性,极大地增强了通话中的业务丰富性。
新通话业务使能平台南向汇聚实时语音、实时视频、实时数据交互、实时XR和实时AI等五大类交互式能力,北向通过标准API接口实现能力的聚合封装与开放共享,使能各类应用调用新通话能力,完成业务快速创新。
面向业务创新诉求,新通话采用全新的网业分离网络架构,相比传统“烟囱式”创新,可实现多业务复用共性能力,避免重复“造轮子”;同时,该架构既支持核心网络部件的高稳定可靠,又支持业务网元的灵活多变。
新通话作为通话产业的一次突破性创新,从诞生之日起就定位为面向生态的平台产品,使能运营商从传统的语音运营,走向视频和内容运营,给产业带来无限的想象空间。
发展业务生态和内容生态是新通话走向产业繁荣的关键。面向个人,新通话可以提供更好、更丰富的内容体验,例如,借助AIGC(AI Generated Content,AI生成内容)技术把视频通话变成更有趣的数字人通话,在展示个性化形象的同时满足与陌生人通话的隐私保护需求;面向企业,将新通话网络能力向行业开放(例如金融保险、交通物流、呼叫中心等),激发行业应用创新,使能行业通话的效率提升、降本增效。
通过标准北向Open API接口引入多样化的内容源,包括PGC(Partnergenerated Content,合作伙伴产生内容)、UGC(User-generated Content,基于用户生成内容)以及成为当前热点的AIGC,这些都可以作为新通话内容渠道生态的一部分。在网络侧构建原生的超强算力、媒体技术及AI能力,实现更好的内容处理效果。通过新通话小程序机制,终端上能够呈现丰富的内容,让用户进行内容的自定义设置、交互操作和意图表达,从而打通端到端的内容运营化流程。
5G时代是技术变革的时代,AIGC生成文本、声音、图像、视频等技术逐渐成熟,以GPT-4为代表的自然语言大模型走向成熟,通用人工智能逐步成为现实。新技术的发展将有效降低数字人应用成本,提升身临其境的沉浸式用户体验。
新通话技术也将面向未来持续演进,在当前的人与人通信基础上增加数字人通信,引入数字人形象、数字人助理等创新业务,从音视频通信演进到多模态通信,通过语音以及数字人形象、表情或肢体动作与文本之间的转换,实现从语音通信到语义通信的演进。AI和XR等新技术将大幅提升通信体验和效率,同时新技术也将充分利用网络的超强算力、超高带宽和超低时延,实现网络普惠用户、丰富沟通与生活,让科技有温度,让沟通无障碍,开启通话新时代。
免责声明:文章内容和观点仅代表作者本人观点,供读者思想碰撞与技术交流参考,不作为华为公司产品与技术的官方依据。如需了解华为公司产品与技术详情,请访问产品与技术介绍页面或咨询华为公司人员。