當前位置:文書都 >

實用範文 >論文 >

專利資料探勘的論文

專利資料探勘的論文

一、專利資料探勘

專利資料探勘的論文

資料探勘技術是延伸和擴充套件了傳統分析方法,可以發現傳統分析方法不能發現的內容和規律,並且它將人們從單調、枯燥的閱讀專利文獻的工作中解放出來,使用計算機代替了人類勞動,這樣不僅提高了效率,而且提升了準確度。因此,資料探勘作為一個專利分析的強有力工具被引入到專利分析中來,並且得到快速的發展應用。專利資料探勘流程應考慮的問題:一是用資料探勘解決什麼樣的問題;二是為進行資料探勘所做的資料準備;三是資料探勘的各種分析演算法。故專利資料探勘的一般過程通常按照以下步驟來完成:領會資料探勘的目的,獲取分析所用的資料集合,探索、清理和預處理資料,選擇要使用的資料探勘技術,使用演算法解決問題,解釋演算法的結果。而其一般流程可簡化為三個階段:資料準備→資料探勘→結果解釋和評價。本文采用簡化的流程進行實證分析。

二、石家莊地區製藥企業專利資料探勘

本文對石家莊地區製藥企業的專利資料進行挖掘分析,挖掘物件是華北製藥集團公司、石家莊製藥集團有限公司、石家莊神威藥業股份有限公司、石家莊四藥股份、河北以嶺藥業股份有限公司、石家莊市華曙製藥集團、河北醫科大學製藥廠、河北聖雪大成製藥有限責任公司等地址在石家莊且具有一定代表性的藥企,希望通過這些藥企資料能夠找到石家莊地區製藥領域的核心組成,並能為藥企更好地發展提供有力的資訊支援。IPC號是目前權威的專利技術主題的標識編碼之一,基本包含了各行各業的專利資訊,是一個龐大的專利資訊體系。目前國內外很多分析方法及技術大部分是基於專利的IPC分類號來分析專利技術主題的,此分析方法有一定的參考價值和科學性,而且對於具有大量專利資訊的分析具有很好的總結概括效果。本文以專利全部IPC號為分析物件,並且構建IPC號之間的關聯規則,在最大程度上揭示隱含的專利技術關聯性,從而為石家莊地區製藥企業專利技術的發展提供參考。

1.資料準備。資料來源的準確與否是資料分析與挖掘的基礎,是資料分析與挖掘的根本。本文所使用的石家莊地區製藥領域專利資料由萬方資料公司提供,以製藥企業地址為石家莊為檢索條件,搜尋出了包括從1985—2014年間石家莊地區製藥領域專利644條,分別分佈在A、B、C、D、E、F、G、H八個大部。對專利資料庫中的644條專利進行篩選,根據“分類號”欄位限制,它涉及專利資訊的分類,有些IPC所涉及的範圍與石家莊地區製藥領域沒有聯絡或聯絡很小,不宜保留。根據“申請人(專利權人)”欄位的限制,剔除與石家莊地區製藥不相關或製藥企業地址不在石家莊地區的專利。最後篩選出590條最符合該領域特點的專利。由於IPC號在幾乎所有現存資料庫中均是以一個欄位儲存一個專利的所有IPC分類號的,形如:A61K38/26、A61K9/08、A61K47/12、A61P3/10,且每個專利一般都有好幾個分類號,而每個企業又研究大量的專利,所以在進行專利分析之前,需要對專利IPC號進行資料整理。由於過於細緻的IPC分類號並不利於專利主題的分析與揭示,所以本文中採用專利小類分析,就是取IPC號的前4位。並將申請人與其對應的多條IPC號進行拆分,拆分後的資料項有773條,即顯示每個申請人對應的一條IPC分類號。

2.資料探勘。本文資料探勘過程將採用Excel和SQLsever2005軟體,首先對所得到的資料匯入SQLserver2005進行挖掘,利用SQLserver2005可以直接進行IPC號的關聯規則挖掘,然後對專利資訊進行分析。

3.資料探勘結果與分析。基於關聯規則製作依賴關係網路圖,可以更加直觀地看到各個IPC號之間的關聯和依賴狀態。

(1)以A61K、C12N、C12P、C07D、C07C為中心的核心專利技術群。這些專利的IPC分類號是關鍵部分藥物組成的各種化合物即藥物主要成分的重要聚集組。A61K(醫用、牙科用等的配置品)是項集次數最多的,即支援度較高的,C12P(發酵或使用酶的方法合成目標化合物或組合物或從外消旋混合物中分離旋光異構體)、C12N(微生物或酶;其組合物)、C07D(雜環環合物,例如鄰氯苄星青黴素的合成)、C07C(無環和碳環化合物)通過專利相關知識我們已經知道這些都是藥物的合成成分,即土黴素、鏈黴素、青黴素等多種抗生素和維生素的.主要成分組成,是製藥領域的核心。這也是和石家莊地區製藥企業的核心領域相符合的。另外這些專利主題的相互關聯、依賴說明了石家莊地區製藥企業在該領域具有很好的佈局網路,在研發數量上也佔有一定優勢,所以說是石家莊地區製藥企業的主要研究領域。

(2)以B65G、C12M為中心的輔助裝置專利技術群。藥品的生產離不開裝置的支援,所以裝置方面的專利也能體現製藥企業的技術水平。在圖1中也能體現出來,專利間有著很強的依賴性和關聯性,在核心專利周邊有B65G(運輸或貯存裝置,例如裝載或傾斜用輸送機、車間輸送機系統、氣動管道輸送機)、C12M(酶學或微生物學裝置),這些是製藥的輔助技術手段,與中心專利是相互聯絡的,也是製藥過程中必不可少的,在這些方面的提高有利於製藥核心領域的發展。先進藥品的研製離不開先進製藥裝置支援,所以裝置水平的提高也是關鍵的。如圖3所示,石家莊地區製藥企業在這一方面的技術依賴網路也已經形成,說明在此技術領域也已經擁有較強實力。但與中心主要專利相比,輔助裝置專利技術還是需要不斷提高的。

三、總結

對專利的研究有著巨大的潛在價值,我們能通過資料探勘技術對專利進行挖掘,發現隱含在其中的有用資訊,為企業的有效發展提供保障。石家莊地區製藥企業在專利方面是河北省此領域的發達企業,所以發現其中隱含的價值及蘊含的規律能帶動河北省製藥行業快速發展,同時也能發現自己存在的問題。總的來說,我們只有利用挖掘工具把資料轉化為有用的資訊,才能幫助企業制定有效的決策,才能在市場競爭中獲得優勢地位。本文有很多不足之處,還有待更為深入的研究。

  • 文章版權屬於文章作者所有,轉載請註明 https://wenshudu.com/zh-tw/shiyongfanwen/lunwen/zjz9wo.html
專題