當前位置:文書都 >

實用範文 >論文 >

專利數據挖掘的論文

專利數據挖掘的論文

一、專利數據挖掘

專利數據挖掘的論文

數據挖掘技術是延伸和擴展了傳統分析方法,可以發現傳統分析方法不能發現的內容和規律,並且它將人們從單調、枯燥的閲讀專利文獻的工作中解放出來,使用計算機代替了人類勞動,這樣不僅提高了效率,而且提升了準確度。因此,數據挖掘作為一個專利分析的強有力工具被引入到專利分析中來,並且得到快速的發展應用。專利數據挖掘流程應考慮的問題:一是用數據挖掘解決什麼樣的問題;二是為進行數據挖掘所做的數據準備;三是數據挖掘的各種分析算法。故專利數據挖掘的一般過程通常按照以下步驟來完成:領會數據挖掘的目的,獲取分析所用的數據集合,探索、清理和預處理數據,選擇要使用的數據挖掘技術,使用算法解決問題,解釋算法的結果。而其一般流程可簡化為三個階段:數據準備→數據挖掘→結果解釋和評價。本文采用簡化的流程進行實證分析。

二、石家莊地區製藥企業專利數據挖掘

本文對石家莊地區製藥企業的專利數據進行挖掘分析,挖掘對象是華北製藥集團公司、石家莊製藥集團有限公司、石家莊神威藥業股份有限公司、石家莊四藥股份、河北以嶺藥業股份有限公司、石家莊市華曙製藥集團、河北醫科大學製藥廠、河北聖雪大成製藥有限責任公司等地址在石家莊且具有一定代表性的藥企,希望通過這些藥企數據能夠找到石家莊地區製藥領域的核心組成,並能為藥企更好地發展提供有力的信息支持。IPC號是目前權威的專利技術主題的標識編碼之一,基本包含了各行各業的專利信息,是一個龐大的專利信息體系。目前國內外很多分析方法及技術大部分是基於專利的IPC分類號來分析專利技術主題的,此分析方法有一定的參考價值和科學性,而且對於具有大量專利信息的分析具有很好的總結概括效果。本文以專利全部IPC號為分析對象,並且構建IPC號之間的關聯規則,在最大程度上揭示隱含的專利技術關聯性,從而為石家莊地區製藥企業專利技術的發展提供參考。

1.數據準備。數據來源的準確與否是數據分析與挖掘的基礎,是數據分析與挖掘的根本。本文所使用的石家莊地區製藥領域專利數據由萬方數據公司提供,以製藥企業地址為石家莊為檢索條件,搜索出了包括從1985—2014年間石家莊地區製藥領域專利644條,分別分佈在A、B、C、D、E、F、G、H八個大部。對專利數據庫中的644條專利進行篩選,根據“分類號”字段限制,它涉及專利信息的分類,有些IPC所涉及的範圍與石家莊地區製藥領域沒有聯繫或聯繫很小,不宜保留。根據“申請人(專利權人)”字段的限制,剔除與石家莊地區製藥不相關或製藥企業地址不在石家莊地區的專利。最後篩選出590條最符合該領域特點的專利。由於IPC號在幾乎所有現存數據庫中均是以一個字段存儲一個專利的所有IPC分類號的,形如:A61K38/26、A61K9/08、A61K47/12、A61P3/10,且每個專利一般都有好幾個分類號,而每個企業又研究大量的專利,所以在進行專利分析之前,需要對專利IPC號進行數據整理。由於過於細緻的IPC分類號並不利於專利主題的分析與揭示,所以本文中採用專利小類分析,就是取IPC號的前4位。並將申請人與其對應的多條IPC號進行拆分,拆分後的數據項有773條,即顯示每個申請人對應的一條IPC分類號。

2.數據挖掘。本文數據挖掘過程將採用Excel和SQLsever2005軟件,首先對所得到的數據導入SQLserver2005進行挖掘,利用SQLserver2005可以直接進行IPC號的關聯規則挖掘,然後對專利信息進行分析。

3.數據挖掘結果與分析。基於關聯規則製作依賴關係網絡圖,可以更加直觀地看到各個IPC號之間的關聯和依賴狀態。

(1)以A61K、C12N、C12P、C07D、C07C為中心的核心專利技術羣。這些專利的IPC分類號是關鍵部分藥物組成的各種化合物即藥物主要成分的重要聚集組。A61K(醫用、牙科用等的配置品)是項集次數最多的,即支持度較高的,C12P(發酵或使用酶的方法合成目標化合物或組合物或從外消旋混合物中分離旋光異構體)、C12N(微生物或酶;其組合物)、C07D(雜環環合物,例如鄰氯苄星青黴素的合成)、C07C(無環和碳環化合物)通過專利相關知識我們已經知道這些都是藥物的合成成分,即土黴素、鏈黴素、青黴素等多種抗生素和維生素的.主要成分組成,是製藥領域的核心。這也是和石家莊地區製藥企業的核心領域相符合的。另外這些專利主題的相互關聯、依賴説明了石家莊地區製藥企業在該領域具有很好的佈局網絡,在研發數量上也佔有一定優勢,所以説是石家莊地區製藥企業的主要研究領域。

(2)以B65G、C12M為中心的輔助設備專利技術羣。藥品的生產離不開設備的支持,所以設備方面的專利也能體現製藥企業的技術水平。在圖1中也能體現出來,專利間有着很強的依賴性和關聯性,在核心專利周邊有B65G(運輸或貯存裝置,例如裝載或傾斜用輸送機、車間輸送機系統、氣動管道輸送機)、C12M(酶學或微生物學裝置),這些是製藥的輔助技術手段,與中心專利是相互聯繫的,也是製藥過程中必不可少的,在這些方面的提高有利於製藥核心領域的發展。先進藥品的研製離不開先進製藥設備支持,所以設備水平的提高也是關鍵的。如圖3所示,石家莊地區製藥企業在這一方面的技術依賴網絡也已經形成,説明在此技術領域也已經擁有較強實力。但與中心主要專利相比,輔助設備專利技術還是需要不斷提高的。

三、總結

對專利的研究有着巨大的潛在價值,我們能通過數據挖掘技術對專利進行挖掘,發現隱含在其中的有用信息,為企業的有效發展提供保障。石家莊地區製藥企業在專利方面是河北省此領域的發達企業,所以發現其中隱含的價值及藴含的規律能帶動河北省製藥行業快速發展,同時也能發現自己存在的問題。總的來説,我們只有利用挖掘工具把數據轉化為有用的信息,才能幫助企業制定有效的決策,才能在市場競爭中獲得優勢地位。本文有很多不足之處,還有待更為深入的研究。

  • 文章版權屬於文章作者所有,轉載請註明 https://wenshudu.com/shiyongfanwen/lunwen/zjz9wo.html
專題