本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

搜索

国家超级计算济南中心联合华为发布《算力互联网技术白皮书》

2021年11月12日

[中国,北京,2021年11月12日] 今日,在2021第三届中国超级算力大会上,国家超级计算济南中心(以下简称“济南超算”)联合华为重磅发布《算力互联网技术白皮书》(以下简称“白皮书”),围绕算力互联网发展趋势和技术挑战,阐述算力互联网解决方案的架构、关键技术,以及实践经验,以加速未来计算模式转变,推动计算性能维持指数级增长。

在“十四五”规划与2035远景目标的政策背景下,数字经济成为国民经济发展的重要引擎。山东是中国的经济大省,也是创新大省。山东省的“十四五”规划中特别提到,要加快发展数字经济,推动数字产业化,打造先进计算、信创等具有竞争力的数字产业集群,其中一条就是要支持济南建设中国算谷。面向未来算力大趋势,济南超算的愿景是要打造供给算力的超强大脑,超算生态的高端基地,培育产业链群的专业园区和计算学科的中坚力量,聚集创新资源的重要载体,并拓展国家合作的开放平台。

国家超级计算济南中心联合华为发布《算力互联网技术白皮书》

济南超算研究员张玮表示:“超算业务具有强算力、大数据、高通量等特点,但当前也面临用户接入难、算力变现难、算力资源使用不均衡、安全防护难的问题。因此,需要构建一张具备集约化、高算力、服务化和高安全四大特征的算力互联网。济南超算携手华为先行先试,围绕算力互联网率先突破,取得了显著的效果。”

此次联合发布的白皮书中提出了算力互联网解决方案,以算力资源为核心,支持网络动态感知算力资源分布,实现动态调整最优路径并提供差异化保障服务,从而满足新一代超算数据中心大规模超算组网的需求。算力互联网解决方案由算力生产网、算力配给网、算力一体安全组成。

  • 算力生产网:作为各算力资源池的基础网络,算力生产网是计算中心的动脉枢纽,为算力资源的充分释放提供基础支撑。通过全以太网络和直连拓扑等网络架构创新构建集约化算力中心,降低建网和运维成本,同时满足更大规模组网的需求,助力算力普惠。通过智能无损网络和网算一体等算网融合技术,实现总线级数据通信能力,更高效地释放集群算力。通过长距无损算法,实现多算力中心间网络流量的预测性调整控制,支撑区域内算力高效调度。
  • 算力配给网:作为各算力中心连接的骨干通道,算力配给网实现用户与算力中心的高速互联和算力中心之间的高速互联,基于SRv6协议实现业务自动化开通,支持任意连接,让算力触手可及;通过FlexE网络切片技术实现算力差异化服务,为敏感类业务提供安全隔离能力;通过智能运维实现故障精准定位定界,最终让用户像使用电力一样便捷地享受算力服务。
  • 算力一体安全:算力安全是算力互联网的基础。传统的边界防护手段存在很多局限性,已无法满足新形势下的算力互联网安全需求。为了实现算力一体安全,所有安全能力以内建的方式为产品和解决方案提供各种安全机制,所有接入网络的实体对象都要具备唯一可信任的身份,并通过动态持续检测来实时识别风险,实现云网安一体的安全协同防护。

基于算力互联网的整体架构,张玮还分享了基于业界首个算力互联网络的联合创新测试结果。测试表明,在算力生产网,开启网算一体后的RoCE网络,相比超算专网的任务完成时间最大减少27%;采用直连拓扑相比传统CLOS组网,计算性能最大提升29%;基于长距无损算法,从济南-淄博的RoCE网络平均时延最多可降低49.8%。在算力配给网,部署SRv6后,带宽利用率提升50%;开启随流检测功能,可以实现分钟级故障定位。

未来算力网络将从算力互联走向算力协同,进而探索算力融合。济南超算与华为将继续携手合作,通过统一算力服务平台,实现多超算中心的统一资源管理、统一用户管理、统一记账、资源融合调度、和应用协同服务,进而实现高效利用算力资源和高质量用户服务,为行业和重要应用领域的科学研究、经济建设和社会发展提供优质的算力基础设施,实现国家超算中心的可持续发展。

TOP