本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>
DCI首先要应对的是流量的压力: 云服务是IT行业的共享经济,而数据中心是云服务的载体。由于土地资源和机房空间的限制,数据中心逐步分布式建设,需要通过数据中心互联(DCI)把多个数据中心集中对外提供统一服务。随着越来越多的业务迁移上云,DCI的流量洪水不断刷新新的记录,给DCI带来极大的压力和挑战。同时云做为集约化经济的代表,不断追求土地、机房空间、能源、光纤等资源的最大化利用,很多客户也是租用光纤、租用机柜,比如在亚太某城域内每公里光纤月租金70~85美金,一旦跨城域租金甚至高达150美金;而每个机柜的月租金也高达850~1150美金不等(含电费、空调费),如何最大化光纤和机柜空间的价值是DCI要解决的问题。
不断追求更宽集成度更高的DCI方案: 数据中心作为流量的高地也是技术创新的高地,首先要构建极速的、无阻塞的DCI互联。
一方面需要极致利用光纤频谱资源,从现有的C波段,扩展到Super C波段,实现从80波到120波的升级,需要在硬件设计,算法,芯片,激光器,接收器,放大器等系统组件上实现技术突破。
另一方面提升每个波长的承载容量,目前,单波100G/200G已成为DCI主流商用技术,单波400G/600G已有成功商用案例,单波800G预计也将在明年实现商用。实现单波高速传输的关键在于提升传输性能,通过算法提升在物理信道上实际部署的能力。在集成度方面,业界目前多采用光层和电层分开盒子的方式,每U的容量在1.2T~2.4T之间,未来随着更高单波速率的提升,设备密度将成倍提升。同时,如何简化光层,探索光电一体化的DCI设备形态,也是未来改进的方向。
DCI开局现状, 非波分背景的从业人员: 企业客户DCI的运维人员都是偏IT能力背景的,缺乏波分专业知识。负责DCI运维的人员也比较少,比如某ISP DCI运维团队只有十几个人,管理着全球成千上万台设备,远端站点的开局安装、扩容及日常的上站维护,一般依靠第三方外包人员,他们就更加缺乏WDM的专业知识。
传统波分的开局时间长达数周: 从上站安装、连纤、配置、调测、业务上线等一系列操作,耗时长,据典型客户统计数据站点安装往往需要数周,繁琐而专业。云业务快速发展和上线,改造扩容甚至天天有,这对运维人员而言简直是个噩梦。比如尾纤部署,一根根连接耗时长,最可怕的人工连纤出错概率高,据统计甚至高达5%,如果一不小心连错,业务不通从上至下排查原因,重新检查校验就更加耗时费力。物理连纤完成后,对应在网管上也要一根根逻辑连纤,重复物理连纤的动作。
因为光是复杂而精密的系统,业务上线需要十几步复杂专业的配置和调测。配置网元管理通信的基本参数,配置波长,调测光功率、光平坦度等,波分端到端系统各个站点、各个模块、各个参数又互相影响,牵一发而动全身,这种调测都是需要专业的知识和非常丰富的经验,人工调测要非常精细而耗时。对于企业客户而言,常常是不可能的任务,他们的心声就是简单、简单、再简单,重要的事说三遍。
DCI解决方案要简化开局流程,首先要降低专业性,实现极速开局:让运维人员从繁琐专业的开局中解放,比如如何在流程的每个环节中做简化和自动化处理,怎么简化光层,把能省的光纤连接省掉。同时网管的逻辑连纤是否能自动发现,波长等参数能否自动匹配,专业的调测是否能自动调测等。未来的方向是简化一切可以简化的连纤、配置和调测,能自动化的绝不留给人工,实现一键开局,让IT人员也会开局,把原来数周的流程能缩短到分钟级,支撑业务云化快速上线,和频繁扩容。
日常运维后知后觉,故障影响严重: 业务上线后的运维,也变得越来越焦虑。越来越多的应用运行在云上, 云服务商上线成百上千个服务,DCI故障后业务影响越来越严重。据新闻报道某跨国云服务商出现全球性故障,全球多个节点出现故障,多家SaaS 服务商因此无法提供服务。在客户整个IT系统架构中,DCI做为支撑性的基础,承载着DCN交换机、存储服务器、IT应用等,上层业务往往更先感知业务中断,一旦故障各个部门的投诉如雪片般飞来。DCI运维部门往往后知后觉,非常被动。
DCI需要更智能的运维方式: 要实现从人工到自动,从被动到主动的运维转变,引入智能运维是必然的选择。首先需要输入大数据,布置无处不在的光传感器, 对网络进行秒级的实时监控。同时通过强大的芯片算力和决策算法,提前预知网络健康状态,健康早知道,心里就不慌。 在出现故障之后还可以通过能力快速迭代计算,快速找到根因告警。这样一来可以实现精准的故障定位。基于智能运维框架的搭建,未来可以实现更多的应用,让IT人员实现他们的咖啡运维梦想,让他们可以边喝咖啡边做运维,一切自在掌握,轻松自在。