本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

搜索

CloudEngine 16800解密系列3:分布式AI运维,加速迈向自动驾驶网络

2019-01-23
1766
0

当数据中心为人工智能提供了充分的技术支撑时,人工智能也给数据中心带来巨大的收益。例如借助telemetry等技术将异常信息送到集中的智能运维平台进行大数据分析,这极大提升了网络的运维效率,降低了运维难度和成本投入。但是,当前计算和存储正在融合,数据中心服务器集群规模越来越大,分析的流量成千倍的增长,信息上报或者获取频度从分钟级到毫秒级,再加上信息的冗余,这些都使得智能运维平台的规模剧增,智能运维平台对性能压力不堪重负降低了处理的效率。如何减轻智能运维平台的压力,在“网络边缘“进行本地智能分析和决策,成为提升运维效率的关键。

基于边缘智能,实现本地推理和实时快速决策:智能运维平台的分析模型准确率并非是一成不变的,会随着数据分布、应用环境和硬件环境的变化而变化,始终保持准确率在期望的范围内对于网络智能分析系统是必须的。CloudEngine 16800业界首款面向AI时代的数据中心交换机,使得交换机具备本地推理和实时快速决策的能力,经过本地设备预分析聚合处理的数据通过Telemetry上送智能运维平台进行二次处理。这种分布式的运维架构,转发设备和智能运维平台配合,实现网络的智能运维。

基于专业经验库,实现故障智能分析:深度学习模型需要通过大量的数据训练才能获得理想的效果,训练样本的稀缺使得人工智能即使在经历了算法的突破后依然没能获得规模应用,而机器学习和专家经验库的结合可使智能运维平台的效率更高。基于iNetOps智能运维算法,华为提供了超过72类典型故障秒级根因分析的能力,使故障自动定位率达到90%。

通过具备本地智能能力的CloudEngine 16800结合集中的FabricInsight网络分析器,构建分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位,使能自动驾驶网络加速到来。

万物互联的智能世界正加速到来,数据中心正成为5G、人工智能等新型基础设施的核心,CloudEngine 16800,是业界首个基于AI芯片实现数据中心网络分布式运维的AI交换机。华为数据中心网络与AI技术的互相支撑,互相应用正在经历局部探索到全面应用阶段,随着AI技术日趋完善应用日渐广泛,其价值持续得以确认,AI技术终将赢得属于自己的环境。CloudEngine 16800的发布是AI技术和网络互相渗透的完美结晶,是交换机代际发展史上的里程碑式事件。随着CloudEngine 16800的规模商用,AI与网络必将日益显现其巨大的技术互补性和溢出效应,我们必将迎来AI应用与网络效率全面提升的黄金发展期。

TOP