本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

搜索

全球顶会SIGCOMM录用智能无损独创技术论文

2021-08-30
2060
4

近日,华为超融合数据中心网络智能无损技术论文《ACC: Automatic ECN Tuning for High-Speed Datacenter Networks》入选ACM SIGCOMM 2021,表明超融合数据中心网络的智能无损技术得到业内专家的一致认可,具有世界级技术影响力。

SIGCOMM是美国计算机协会在通信网络领域的旗舰型会议,也是目前国际通信网络领域的顶尖会议。SIGCOMM对论文的质量和数量要求极高,质量方面要求具有基础性贡献、领导性影响和坚实系统背景。SIGCOMM录用的论文大多数会被广泛引用,具有非常大的影响力。

全无损以太核心算法:华为独创ACC技术

本次入选的华为ACC(Automatic ECN)技术是华为全无损以太网络智能无损技术的代表。当今,随着AI和云业务发展,数据中心承载着诸多需要高带宽和低延迟的应用,包括大数据处理、分布式存储和高性能计算。而在已经广泛部署的拥塞控制方案中,显示拥塞通知(ECN: Explicit Congestion Notification)在保障网络和业务高带宽低时延中起到关键作用。但是传统的静态ECN参数配置,无法自适应数字时代种类繁多的动态业务流量模型。例如,在不同厂商交换机、网卡等组成大型异构数据中心网络中,协同联调静态ECN参数变得非常困难;尤其在云多租户网络中,存在不同时空流量模型,导致网络工作负载动态变化,需要不同时间点适配ECN参数,事先配置的ECN参数则无法满足动态业务流量的性能需求。因此,在大规模高速组网和多租户业务流量等复杂场景下,人工调整全网适配ECN参数成为巨大挑战。

基于此,华为联合南京大学设计和实现ACC。ACC通过在超高速数据中心交换机中首次成功应用深度强化学习(DRL:Deep Reinforcement Learning)技术,自适应流量模型来动态调整ECN参数,从而简化网络运营,实现网络高利用率和低延迟。同时, ACC设计分布式多智能体技术实现大规模组网下可扩展性、基于商用交换芯片Telemetry能力实现快速可部署性、结合在线和离线训练方式提高场景的可泛化性,从而最终达到大规模高速网络的高吞吐和低时延性能目标,并且从业务层面保障应用性能表现最优。

华为超融合数据中心网络CloudFabric 3.0,新以太释放新算力

在ACC理论研究基础上,华为推出了超融合数据中心网络CloudFabric 3.0解决方案,保障网络高吞吐低时延,100%释放算力。

华为超融合数据中心网络CloudFabric 3.0方案基于全以太架构构建0丢包的计算和存储网络,助力算力100%释放。该方案打破通用计算、存储、高性能计算三套网络架构的限制,统一使用以太网架构实现流量承载融合。该方案在业界率先实现L3自动驾驶网络能力、全生命周期自动化与全网智能运维,OPEX降低30%,使能企业智能化升级。

华为数据中心网络已经在全球包括金融、政府、互联网、制造、能源等各大行业客户的数据中心部署。华为将持续投入智能无损技术研究,持续提升网络能力,充分释放算力,使能企业智能化升级。

免责声明:文章内容和观点仅代表作者本人观点,供读者思想碰撞与技术交流参考,不作为华为公司产品与技术的官方依据。如需了解华为公司产品与技术详情,请访问产品与技术介绍页面或咨询华为公司人员。

TOP