本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>
“存储”这个词对很多人来说熟悉又陌生。比如平常我们用的电脑里有硬盘,手机里的内存,然后U盘,或者机房里大型的存储设备。有数据的地方就需要存储,数据是数字经济时代的“石油”,数据存储到底有多重要?海量数据如何存得下、流得动、用得好?数据存储的极限在哪里?陈鲁豫带着灵魂三问来了。
于浩澎:数字化以及数据存储对医疗界产生的影响可以从两个角度来展现。在患者角度,只需要通过手机进入医院APP预约,不仅知道能否挂得上号,还可知道找到医生的大概时间点;问诊之后,可以电子化缴费。甚至患者做完检查,只要收到电子报告就可以重新去找医生。
从医疗工作人员角度,比如新冠的溯源。把病毒的基因组序列测出来,然后跟已知发现的病毒基因组序列数据进行比对,从而有效阻止病毒的传播。
张福鹏:华为存储是企业级存储,服务于企业的生产、运营和研发。它存储的数据有三大要求,即数据不能停,数据不能等,数据不能丢。
数据不能停是什么概念呢?比如东京证券交易所发生过数据中心失效的情况,交易暂停一天,经济损失很大;国内也有某互联网公司数据被员工恶意删除,造成1.5亿人民币的损失。
数据不能等,很有名的就是钟南山院士给华为存储写了一份感谢信。在抗击广州疫情时,每天要处理几百万份核酸检测样本。但如果用传统存储,性能无法满足3~4天就完成一轮检测。华为提供了一套最先进的OceanStor高端存储,大幅提升检测效率。
数据不能丢,银行的存储数据也是数字化的。数据如果彻底丢了,存款也就等于损失了。此外,数据存储对于文明的传承也至关重要,比如巴黎圣母院被烧毁,但因为它已经全部数字化,其所有数据被保存,所以能够实现复原和重建。
艾春荣:数据已经成为新的生产要素,是未来新型数字经济的一个非常重要的核心资产。数据存储已经成为国家数字化的基础设施,数据产业化的重要执行平台。
于浩澎:医院流动数据一般可以分成两种类型。一种是结构化数据。比如病人的姓名、身份证号、年龄,以及各种各样的检验。另一种是非结构化数据,比如CT影像类的片子。医院有各种各样的数据,应该以什么样的方式进行存储,以便能够快速调用;以及数据产生时,能快速写入,这是医院面临的一个非常重要的问题。又如测完基因组数据之后,需要非常专业的处理加工,需要大概20个小时,增强了算力后能把时间压缩到2个小时。但是由于之前存储的性能不是特别高,会导致CPU算得快,但是数据读取的速度慢,导致上限只能控制到2个小时。后来我们和华为合作,使用了一套专用存储方案,它能够彻底克服存储瓶颈,最终让基因测序从2个小时直接压缩到了8分钟,实现了质的飞跃。
张福鹏:于教授提及的场景是非常鲜活的。以前的数据就是简单的病历,只是做了简单的处理和运算;现在还要把病历跟基因数据做大数据分析、人工智能对比。
它要满足多样要求,第一是提供百倍的性能;第二是提升百倍的容量密度,即更少的空间能存下更多数据;第三是多样性的算力需求,包括科学计算、大数据分析、人工智能等。这些会成为普遍需求。
艾春荣:除了在医疗领域,在天文领域、经济学领域,产生的数据也是海量的。这些海量的数据存储后一定要分析,把更多的信息挖掘出来,然后跟应用场景结合起来,才能创造价值。
陈鲁豫:企业肯定是需要转型,政府需要更好的技术平台。面对海量数据的存储,还有增长越来越快的需求,我们要怎么样去应对?
张福鹏:数据的处理加速,不仅在传统的信息化生产中,也大量应用到关键的科研和生产环节中。比如天气预报、油气勘探、卫星大数据。
那么有几个方向比较重要:一是要提升存储的密度。华为做了很多面向高密度的设计,使得我们一台存储能够存下的数据,是普通存储物理容量的5倍,如果加上华为数据存储的缩减算法,可能达到普通存储的5~10倍,我们正在向着百倍这个目标前进。
此外,当数据规模大的时候,往往需要多套存储分别储存数据。华为致力于将N套存储变一套存储,所有的数据全局都统一管理,多协议的互通。通过混合的负载,实现一存多算、一数多算,进而简化整个生产和科研过程。
于浩澎:这是一个比较哲学的问题,广义来讲信息其实是无限的,但是存储空间是有限的。未来要探索一个问题,如何在有限的介质里去存储更多量的信息。随着科技迭代,未来要不断打破界限,突破存储的上限。
陈鲁豫:数据肯定是会永恒存在的,那我们的存储能力,如何不断提升?
张福鹏:以后的存储要做到内存级,能快速读取从而实现数据不用等。我们也期望存储能够海量地存,未来也将探索用DNA来存储。此外我们也在考虑用蓝光光碟替代磁带,蓝光能存50年。如果以后纳米玻璃存储能实现的话,可以存300年到500年。
刚才说的存储的密度,华为掌握了很多核心和底层技术,将存储的介质,跟电路板、芯片等元器件结合起来,实现闪存盘尺寸小密度高。比如Half Palm盘,只是手掌一半大,但它已经有近8TB容量。这只是华为在介质上面的一个创新。
陈鲁豫:我们做的一切都是记录,记录的核心是什么呢?如果你没有数据的话,我们可能会记不住过去,看不清现在,也无法展望未来。所以,我们希望这一切,都要被看见,也值得被看见。感谢大家!
免责声明:文章内容和观点仅代表作者本人观点,供读者思想碰撞与技术交流参考,不作为华为公司产品与技术的官方依据。如需了解华为公司产品与技术详情,请访问产品与技术介绍页面或咨询华为公司人员。