本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

搜索

AI加持,避免1.6亿美元损失!

2021-11-01
1259
0

近日,某互联网公司遭遇全球大规模宕机,所属多个社交APP离线超过24小时,预计给全球经济造成1.6亿美元的损失。

对于这次史无前例的故障,一时间众说纷纭,有人说都是“远程”惹的祸,有人立刻复盘自家系统避免重蹈覆辙。而细查过往,宕机事件并非个例,如何加强网络运维,才是避免宕机事件的根本。

随着虚拟化、云计算等技术的大量使用,数据中心作为企业的生产中心,其网络复杂度指数级增加,但运维工程师数量无法对应线性增加,传统依靠专家经验定位的运维手段,已无法跟上数字化时代的运维诉求,向智能运维转变也成为业界一致认同的方向。

华为iMaster NCE-FabricInsight数据中心网络分析器,可智能分析对成千上万条无序的网络和业务数据,带来全新的网络智能运维体验。

iMaster NCE-FabricInsight可用在哪些场景呢?

场景一:日常巡检,全网健康实时评估和预测

传统运维:以证券行业为例,每天开市前需要投入3人检查1小时

智能运维:基于Telemetry收集多源数据,并将知识图谱技术引入网络运维,将海量的网络设备指标关联起来,实时全面评估多云多厂商网络健康情况,并结合AI技术主动感知网络异常行为的变化,预测未来流量、容量等风险,自动生成评估报告并推送到邮箱,提前风险预警。


场景二:故障处理,3分钟定位根因,5分钟恢复闭环

传统运维:依赖人工经验,平均故障定位时间长达76分钟,网络需自证清白

智能运维:华为根据30多年运维经验、上千数据中心客户的网络故障场景,梳理典型的故障类型,并持续进行故障演练实践。结合知识图谱自学习,不断累积故障知识库,目前华为iMaster NCE-FabricInsight已实现75种常见故障1分钟感知、3分钟自动定位根因,支持未知故障推理;同时联合华为控制器iMaster NCE-Fabric智能分析故障影响,推荐优先故障处理预案,典型故障5分钟快速恢复闭环。


场景三:网络变更保障,全网上万业务秒级验证,差异自动对比

传统运维:变更前后需要人工比对设备配置、表项等数据,效率低;通过Ping、Traceroute简单验证变更前后的业务连通性,人工难以遍历网络所承载的成千上万级应用互访;

智能运维:自动对比变更前后的配置、表项、性能、拓扑等差异,验证效率提升10倍;并建立整网的网络转发模型,通过形式化验证算法进行穷尽式的意图验证,可秒级验证上万级业务连通性。打个比方,这就像是打造一个城市的路网地图导航,通过输入起点、终点、途经点,就能自动将所有路线标出,识别是否有不通路线,以及不通的原因,从而保障业务运行0风险。


场景四:网络优化,业务级运维保障

应用与网络系统隔离,数据孤立,出现异常特别是质差类故障,需要多部门协同定位长达数天。如何统一视角,建立一体化运维成为IT运维部门的一大难题。

华为iMaster NCE-FabricInsight提供100多种数据服务开放,拖拽式灵活整合,分钟级发布场景化的服务APP,与第三方系统集成周期缩短到天级,彻底解决多套运维数据整合难的问题。


目前华为iMaster NCE-FabricInsight已和天旦业务性能管理BPC携手联手打造业务级智能运维,构建覆盖Underlay和Overlay的业务和网络一体化运维能力,并在金融、政府等众多行业中应用。


在数字经济的浪潮下,保持稳定的网络是构筑商业成功的基础。华为iMaster NCE-FabricInsight,作为华为超融合数据中心网络CloudFabric 3.0解决方案的重要产品之一,已在金融、教育、政府、大企业等行业客户成功商用,它基于AI提供网络全场景智能运维,并与合作伙伴、各行业客户进行灵活服务化集成,提升网络运维体验,帮助各行业客户实现商业成功。

免责声明:文章内容和观点仅代表作者本人观点,供读者思想碰撞与技术交流参考,不作为华为公司产品与技术的官方依据。如需了解华为公司产品与技术详情,请访问产品与技术介绍页面或咨询华为公司人员。

TOP