在数字世界中寻找能源宝藏
当前,石油勘探与开采已经高度依赖信息技术,通过高性能计算更加科学的数据采集和数据分析,保障油气资源的高效开采。在整个数据处理过程中,中海油面临着数据量大、带宽要求高、可靠性要求高、扩展性高、数据归档要求等存储挑战,对存储系统的性能、带宽、可靠性和扩展性提出了更高需求。
解决方案
应用产品:Ultrastar DC HC500系列硬盘
中海油前后选用上百台Infortrend DS与GS产品,为了确保整个存储系统具有更加出色的可靠性,普安科技选用了西部数据Ultrastar DC HC500系列硬盘配合Infortrend DS存储系统。
项目收益
基于西部数据高性能、高可靠性硬盘,配合DS SAN存储与GS统一存储解决方案,实现了软硬件的很好结合,满足了中海油长期以来对于数据存储、分析的需求,加大了对海量数据中的能源探索力度。
项目背景
中海油服务股份有限公司业务涉及钴井服务、油井技术服务、船舶服务、物探勘察服务四大板块,下属天津分公司是主要负责渤海海域石油天然气资源勘探开发生产。
为了精确测量出原油所在区域,中海油建立了庞大的数据计算中心,采用先进的分析工具,在日益庞大的数据群中收集具有更高真实性的数据并进行分析。
数据中心的处理流程可以分为3个步骤:
-
数据汇总和初步处理
从井下传感器、地音探测器和水中地震检波器等各种方式收集的初始数据会在数据中心汇总。因为初始数据的信息会受到叠加干扰和被一些外界因素扭曲,因此必须进行清洗和加工以转化成可以分析的数据。
-
数据分析
通过高性能计算网络(HPC)进行计算。内容主要是震波资料分析及油藏模拟。
-
分析结果的解析
按照分析的结果推断油气有关的信息,如最佳的打井位置、油气的蕴藏量、岩石性质等。这些分析结果将会为后期的勘探生产提供确切的依据。在作数据分析处理时,计算网络主要担负着并行计算时的数据通讯和并行文件系统的数据传递。
存储系统面临的挑战及需求
-
数据量大
除了初始数据外,分析过程中会产生大量的中间数据(初始数据的10~20倍)。此外,由于数据分析的周期需时较长,为免在分析过程中出现事故而需要重新运算,HPC系统会使用“checkpointing”技术周期性地保存计算的状态和中间数据,这样更会增加数据量。
-
带宽要求高
计算节点和存储节点的数据交互次数不频繁,但是数据量大,即对网络带宽和存储节点的带宽要求高。
-
可靠性要求高
中间数据和结果数据都是珍贵数据,是通过大量的时间和资源的投入得出来的,所以对存储的可靠性要求高。
-
扩展性高
不同任务的计算集群,共用一个存储系统,避免数据迀移。
-
数据归档要求
中间数据和结果数据需要归档。
解决方案
中海油先后选用数百台Infortrend普安科技DS与GS产品,以满足多种数据的快速存取,并为客户端提供足够的带宽进行数据分析。
为了确保整个存储系统的可靠性, Infortrend在其系列产品中选用了西部数据12Gb/s SAS接口的Ultrastar DC HC500系列硬盘。
这一系列硬盘是专门为公有云和私有云环境而设计的大容量硬盘,1块3.5英寸硬盘可提供14TB的存储容量,足可应对数据爆炸的高容量。
以24盘位的Infortrend DS3024R双控为例,如果采用1主机+1x60盘位扩展柜组合配合14TB的Ultrastar DC HC530硬盘,便可以提供高达14TBx84=1.17PB的存储量。
Ultrastar DC HC500还采用了业界唯一的第五代氦气密封式平台HelioSeal技术,大大提高了硬盘的存储密度和降低能耗,传统磁记录(CMR)技术能够在容量企业环境中无缝工作,让云和企业客户的总体拥有成本(TCO)更低。
简单、可靠的解决方案
普安科技已在其大部分产品线都采用西部数据的存储产品和解决方案,西部数据的企业级硬盘大幅度地增加了其系统的扩展性和稳定性。
普安科技中国区总经理杨文仁表示:
“硬盘是存储系统的核心灵魂,对产品质量和可靠性的执着让我们对硬盘的选择非常严格。西部数据产品的优良品质和团队的专业服务态度都能满足我们的要求,为中海油实现数字转型提供了有力的保障。石油石化企业的数据中心设备众多,电力开支巨大。西部数据Ultrastar DC HC500是任务关键型应用系列硬盘,为我们的系统提供了无与伦比的能源效率(Watts/TB )。一方面提高了企业效益,另一方面也提高了IT系统的响应效率,深受企业好评。”
中国海洋石油天津分公司刘工程师表示:
“对于已开发建设了几十年的石油企业来说,数据中心的功能不再是简单的存储与计算,而需要支持整个集团的正常稳定运作。基于西部数据Ultrastar DC HC500 系列的Infortrend DS SAN与GS统一存储解决方案,实现了软硬件的良好结合,满足我们长期以来形成的海量数据资料维护,从TB级至PB级的可扩展需求,保证数据的实时连续可用,加大了对大数据分析系统的探索力度。”