用海量数据感受地球脉动,开启能源勘探新时代
本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>
随着全球范围内石油资源消耗的逐年攀升,石油和天然气行业已经成为HPC(高性能计算)最大的应用和创新行业之一。如何使用HPC找到更多的油层,提供更精准的井位建议,一直引领物探技术研究的创新方向。
中国石化石油物探技术研究院高性能计算高级专家 王永波
中国石化石油物探技术研究院面对新时代挑战,携手华为OceanStor海量存储打造高性能HPC平台,开启数据找油新时代。
油气勘探包括了野外地震资料采集、地震资料处理、地震资料解释三个环节。野外资料的采集包括电磁、重力等技术,目前主要用的是人工地震的方法,就是人工放炮或使用震源车产生人工地震,通过收集从地下返回的地震波,形成野外观察数据。
在地震资料处理环节,通过HPC对观测数据进行信号处理,形成能够反映地下地质特征的数据体。
最后,通过技术人员对数据体进行分析研究,寻找油气聚集区,并提供井位建议。地震资料解释完后,地质专家就可以根据生成的地质构造图,确定哪个地方有油,哪个地方没油,有油的地方储量多少,是否值得开采,开采在哪打井。
油气勘探数据处理过程
油气勘探就好比给地球做CT,采集的数据越多、处理得越精细对地下地质结构的了解就越准确,找到油的可能性就越大。通过持续不断优化HPC技术,在海量的数据中更高效地发现油藏信息,成为中国石化石油物探技术研究院及整个行业孜孜以求的目标。油藏勘探的数据有如下特点:
首先,地震资料采集的数据量非常大,单体原始数据一般几十TB,最大可达PB级,而且处理过程的中间步骤多,产生大量的临时文件和中间结果数据,需要为一个作业分配超过原始数据10倍的存储空间。
其次,地震资料处理的流程多、IO频繁,一个流程下来有几十步,其中可能还有反复的迭代,涉及多达400个软件模块。作业在运行过程中,这些模块需要频繁的交换数据,给内置磁盘和外部存储带来大量读写压力。
第三,地震资料处理的计算量大且周期长,有串行的作业,也有大量计算量大的并行作业,一次计算任务需要数周不中断计算,对可靠有极致的要求。
随着采集精度逐年提升,传统数据处理系统问题开始凸显:分散的建设模式形成多个数据烟囱,数据需要在不同的计算集群间重复拷贝,影响整体数据处理效率;其次,资源的隔离导致数据无法充分共享、资源利用率低;同时,IO处理能力逐渐成为瓶颈,导致CPU等待时长持续攀高,无法充分发挥算力优势。
为了解决当前地震资料数据处理过程中的问题,中国石化石油物探技术研究院选择了携手华为,基于OceanStor海量存储建设融合共享的地震资料资源池,打造更高效和经济的数据分析处理平台。
基于华为OceanStor海量存储的数据处理解决方案架构
• 存储层对于地震资料处理非常关键,计算的速度远远高于磁盘的读写速率。对于中国石化石油物探技术研究院来说,整个地震处理过程中有35%以上的时间是在做数据的迁移和转换,因此大带宽、低时延的存储层成为提升勘探效率的关键。而通过OceanStor海量存储的大带宽、低时延的存储能力,大幅降低IO等待时间,提高计算集群CPU并行处理效率,让CPU利用率稳定在60%以上,最终缩短数据分析时间16%以上。
• 采用基于去中心化架构的OceanStor海量存储实现存储资源的整合与共享,实现机柜数降低40%,整体TCO节省30%,并且可以匹配未来5~10年的数据扩展需求。
• 此外,OceanStor海量存储采用的N+M弹性EC的数据保护模式,允许M台存储节点同时故障,且可以自动缩列,极大的增强数据的可靠性,为地震的长周期处理提供持续性保障。
石油行业正面临数字化浪潮带来的大变革,而油气勘探历来是新兴科技的试验场与磨刀石。油气地震勘探数据具有明显的大数据特征,既有流式处理,也有非流式处理,既有结构化数据,也有半结构化和非结构化数据。未来,大数据和AI技术也将广泛应用到能源勘探领域,进一步提升勘探的效率,通过数据的碰撞和算法的训练,来提升对于油层、井位、储量的预测,将油气勘探带入一个新时代。