數據挖掘技術下數字化油氣藏研究論文

論文
關注：3.41W次

摘要：油氣藏在勘探開發及其研究與決策過程中，形成巨量的成果及數據。為了更加科學開發與管理油氣藏，充分運用和發揮好這些巨量數據的信息作用成為關鍵，數據挖掘作為一種有效的信息處理技術，可以在海量數據中快速找出有用信息，為研究與決策提供強有力的數據支持。長慶油田在油氣藏研究與決策支持系統（ＲDMS）建設中充分利用各專業數據庫及多種數據挖掘方法，構建了一個滿足勘探、開發、儲量管理、評價等綜合應用的數據管理、數據操作及可視化展示的一體化平台，為油氣藏研究與決策人員提供全方位的數據處理與可靠決策，極大地提升了油氣藏的研究效率和決策質量。

關鍵詞：數字化油氣藏；研究與決策；數據挖掘

油氣藏研究包含了從地質勘查到石油產品最終用户的複雜工藝流程，傳統的油氣藏研究方法存在工作效率低、準確性不高、過度依賴人工經驗等問題。決策者需要從海量的數據中找出有用的關鍵信息；論證現場中研究人員攜帶和使用的各類圖件無法充分展示其研究成果，也不能在論證現場短時間內消化大量資料並做出正確的決策，更不能使信息資源的共享和成果的交互上得到充分實現。信息落後的信息處理方法與單一的研究手段不但花費大量的精力與時間，更是造成大量寶貴的研究成果無法應用與共享。近年信息技術的快速發展，催生了數字化油藏，促進了數字油田的發展產，數據挖掘等信息技術與油氣勘探開發數據資源的融合不斷加深，能夠提供更智能化的數據分析功能，更好地支持油氣藏勘探開發決策，開創了一種全新的油氣藏研究工作模式，降低了決策風險，提升開發決策水平。長慶油田針對具有數量龐大的、結構不完整的`、內容不清晰且含有干擾信息的油氣藏研究工作數據，開發了包括特徵提取、規則劃分分類分析、關聯規則挖掘、聚類分析、模式分析及生成趨勢分析等［1－2］系列數據挖掘技術，從中提取出包含在內部的、不被人們知曉的、卻又含有有用的、重要的信息和知識［3－4］，為長慶油田的高效開發、快速發展提供了有效的數據信息支持。

一、油氣藏研究與決策支持系統

通過借鑑國內外著名油氣公司在油氣勘探計算機軟件研發方面的經驗［5－6］，依託長慶油田豐富的數據資源，利用先進的軟件研發技術，長慶油田研發出了一套數字化油氣藏研究（ＲDMS）系統。它以油氣藏研究為主線，業務驅動，數據鏈為手段，由協同工作平台、數據整合平台、數據可視化平台等組成的一體化多學科協同工作環境。數字化油氣藏研究系統從功能架構上可劃分為數據服務、基礎工作、協同研究、決策支持和雲軟件五大平台。基礎工作平台是以油氣藏數據鏈技術為基礎建立的系統底層框架，為各應用場景的協同工作提供基礎環境；協同研究平台面向科研人員，通過對不同業務崗位定製不同工作場景和工作內容，為研究人員提供便捷的數據組織、共享和知識應用平台；決策支持平台面向技術主管和普通技術人員，為一體化技術交流及方案決策提供環境，並實現遠程異地協同決策；雲軟件平台基於虛擬存儲技術將勘探開發主流軟件統一部署在雲中心服務器，實現專業軟件接口統一升級、許可動態調度和集中維護管理。目前，基礎工作平台、研究工作平台（29個研究主題）和決策支持平台（16個決策主題）已基本開發完成，在勘探開發研究院、油氣工藝研究院、採油（氣）廠已推廣運行。圖1展示了數字化油氣藏研究與決策支持系統功能模塊的細分情況。

二、數字化油氣藏的數據挖掘技術

長慶油田建設的數字化油氣藏研究與決策支持系統，為油田生產的勘探部署、產能建設等決策提供輔助。在決策支持系統的建設中採用了數據挖掘技術，在數據分類的過程中使用了神經網絡技術，在數據關聯過程中使用了決策樹方法，在預測過程中使用了迴歸分析和貝葉斯網絡。由勘探井的數據結合模型庫系統和數據倉庫系統，為井位部署、產能預測、生產方法等決策提供支持。在圖2的結構中有一個模型庫系統，它由模型庫、方法庫、數據庫、格式庫、衍生數據庫及其管理系統組成。該系統可被抽象為六元結構，即S={ModelD，methodD，FormD，ParaD，D，DeriveD}。其中，ModelD={model1，model2，…，modeln}，它是模型庫，用於集成各種模型。模型庫為整個系統提供支撐。它有包含模型庫管理子系統（MDBMS）對模型庫進行統一的管理，具有對模型定義、建立、存儲、查詢等功能。模型庫是系統的核心結構。用於油氣藏研究的各種數據庫在模型庫中統一管理、調用；MethodD={method1，method2，…，methodn}，它是方法庫，集成各模型計算的參數獲取方法。方法庫系統為系統提供算法模型支撐，它包含方法庫管理子系統（ADBMS）對方法庫進行統一的管理；FormD為數據格式庫，定義了每個數據的數據類型，數據格式；ParaD為參數庫，用於存放各種油氣藏分析程序運轉的各種參數；D為數據庫，用於存放計算數學模型所需的各種數據；DevriveD為衍生數據庫，存放油氣藏研究過程中產生的新數據。

三、油氣藏數據挖掘技術的實現

1．建立數據倉庫建立數據倉庫是實現數據挖掘的基礎。本系統中使用的是原型法，快速的實現數據倉，並根據反饋信息修改油氣藏決策步驟中不合理的需求分析和主題情況，為後面的決策工作提供技術基礎和經驗積累。本系統主題是油田勘探井位佈置位置、測井實時數據、產能分析、儲量管理等主題。在對油氣藏決策系統進行分析之後，根據油氣藏決策系統中包含的油氣藏數據、決策內容進行邏輯分類。針對各個的分析主題，在油氣藏數據倉庫中建立關係表，用來描述與決策結果相關的各種信息，關係表主要從油氣藏系統數據庫中的流程表中提取數據，包括地質圖、地理圖、地震數據等。在數據倉庫的建設過程中，對油田的盆地、各級構造、圈閉、地震工區、勘探沉積相、各級儲量區塊、油田各類開發生產單元、井等勘探開發圖形對象的轉換、加載入庫，建立完成地質信息庫。

2．油氣藏研究工作數據抽象和總結技術數據總結的最終結果是對油氣藏研究數據進行抽象模型化，給出油氣藏研究決策工作流程的總體綜合描述。通過對油氣藏數據的歸納抽象，數據挖掘方法能夠將數據庫中的所有數據從較低的個體層次抽象總結到較高的總體層次上，從而實現對原始基本數據的總體把握。在本系統中使用的數據總結方法是目前最為成熟的數學方法，也就是利用數學方法計算出數據庫的各個數據項的統計學特徵，如總和、方差、最大值、平均、最小值等；或者通過利用數學中的統計圖形工具，對數據製作統計圖形，如直方圖、餅狀圖等。長慶油田的數字化油氣藏研究系統中利用了OLAP技術實現對油田井位的地質圖、地理圖、地震數據的多維查詢，分析了多種數據的統計特徵，同時用多個統計圖形描述了數據間的聯繫。最後對多個數據進行歸納，提取統計信息。

3．數據分類數據挖掘中的分類是建立需要的分類函數或分類模型。通過這個分類模型可以將數據劃分到不同的組中。它的實現步驟一般是：首先分析工作數據的各種特徵，並找出或者建立出工作數據的屬性模型，確定數據的歸屬組別，然後利用這些模型來分析工作數據，最後預測後面的工作數據可能會屬的分組。分類應用的實例很多，本系統的採油井中，將油田井位出油量分為好、一般和較差三種類型，以此分析這三種類型井位的各種屬性，特別是位置、地質等屬性，並決定它們分類的關鍵屬性及相互間關係。此後就可以根據這些關鍵屬性對每一個預期的井位進行分析，以便決定預期井位屬於哪一種類型。

4．關聯分析原始數據庫中各個工作數據都存在相互關聯、相互影響的聯繫。兩個或多個工作數據的取值之間存在某種邏輯聯繫。這種關聯關係主要有簡單關聯和時間關聯兩種。比如油田井位中的地質環境、地震數據和出油量存在關聯。關聯分析的目的是找出工作數據中隱藏的關聯網，描述眾多數據項目的密切度或關聯關係。由於事先往往並不知道工作數據的關聯是否存在，或者是否可以用精確的關聯函數描述。因此，關聯分析生成的規則通常都帶有置信度，置信度級別描述了關聯規則的強度。

5．聚類與分析油藏工作數據往往缺少比較詳細的描述信息，甚至是無法組織成任何分類模式時，通常可以採用聚類分析。通過聚類分析，按照約定的相近程度度量方法或者其他的標準，將工作數據分成許多有意義的子集合；每一個集合中的數據特徵相近甚至相同，不同數據集合之間的數據性質差異較大，容易區分。長慶油田的數字化油氣藏研究在實現過程中，使用了Fayyad過程模型，如圖3所示。在數據挖掘的過程中，系統執行一個循環迭代過程。在每一步的執行中，從油田的盆地、各級構造、圈閉、地震工區、勘探沉積相、各級儲量區塊、油田各類開發生產單元等數據中，分析出勘探井位的位置信息，如果發現某個階段產生的結果和預想的內容有出入。則重複前面階段步驟。

四、結束語

長慶油田針對油氣藏研究數據量大、信息隱晦的技術現狀，建立了油氣藏研究與決策支持系統［7－10］，並在其中開發和應用了系列數據挖掘技術，取得了較大進展：

（1）與眾多學科及技術相融合，形成了包括人工智能、統計學、數據倉庫、在線分析處理、專家系統、數據可視化、高性能計算等數據挖掘技術，將原始數據庫轉化為有用的研究知識，為油氣藏決策了有力支持。

（2）海量數據及其挖掘技術的開發為油氣藏研究與決策支持系統的高效應用打下了基礎，極大地提高了油氣藏的研究與決策水平，為長慶油田快速發展提供了強有力的技術支持。

參考文獻

［1］郭萌，王珏．數據挖掘與數據庫知識發現：綜述［J］．模式識別與人工智能，1998，11（03）：292－299．

［2］胡侃，夏紹瑋．基於大型數據倉庫的數據採掘：研究綜述［J］．軟件學報，1998（01）：54－64．

［3］GrossmanＲ，KasifS，MooreＲ，etal．Dataminingresearch：Op—portunitiesandchallenges［C］．AreportofthreeNSFworkshopsonmininglarge，massive，anddistributeddata，1999．

［4］Deogu*JS，ＲaghavanVV，SarkarA，etal．Datamining：Ｒe—searchtrends，challenges，andapplications［J］．ＲoughsSetsandDataMining：AnalysisofImpreciseData，1997：9－45．

［5］王宏琳．油氣勘探計算機軟件：平台體系結構框架［J］．石油工業計算機應用，2004（02）：3－8．

［6］（美）HohmannL著．藍莉，曾永和譯．超越軟件架構創建和維護優秀解決方案［M］．北京：中國電力出版社，2005．

［7］石玉江．數字油田中的勘探井位快速部署技術［J］．石油工業計算機應用，2016（12）：11－16．

［8］王娟．數字油氣藏數據中心建設的關鍵技術［J］．石油工業計算機應用，2016（1）：16－18．

［9］付金華，石玉江，王娟，等．長慶油田勘探開發服務型共享數據中心構建研究［J］．中國石油勘探，2017，22（6）：1－8．

［10］王娟，姚衞華，石玉江，等．基於雲架構的油氣藏數據智能管理技術［J］．天然氣工業，2014，34（3）：137－141．

標籤：數據挖掘數字化油氣藏技術論文