當前位置:文書都 >

實用範文 >論文 >

鏈接分析法——情報學研究新方法論文

鏈接分析法——情報學研究新方法論文

【內容提要】本文認為鏈接分析法是網絡信息計量學的重要研究方法,是情報學研究的新領域。它完善了情報學方法論體系,豐富了情報學理論,是情報學逐漸成熟的一個重要標誌。文章簡單介紹了網絡信息計量學,並對鏈接分析法進行了分析。

鏈接分析法——情報學研究新方法論文

【摘要題】理論縱橫

【正文】

20世紀90年代以後,以數字化技術、多媒體技術、網絡通訊技術綜合而成的現代信息技術,引發了人類社會的第二次信息革命,人類業已邁入知識經濟時代。新的社會環境使包括情報學在內的學科研究發展面臨着新的挑戰,我們需要新的理論和方法來加以研究和利用,情報學的傳統方法在面對新的問題時,就要進行自身的轉化。如面對浩瀚的網絡信息資源,傳統的文獻計量學方法就顯得力不從心,相應地網絡信息計量學(WebmetricsorCybermetrics)就應運而生,用新的研究方法如鏈接分析法來描述和組織網絡信息世界。

1 網絡信息計量學

網絡信息計量學是在網絡信息環境下迅速形成和發展起來的,作為信息計量學的一個新的發展和重要的研究領域,它的出現使傳統的基於文獻和信息的文獻計量學、信息計量學面臨着新的變革。關於其定義主要有:網絡計量學是一門計算機科學,是一門研究互聯網上數據相互引用的科學,是一門對網絡文獻規律進行統計分析的科學,基於Web和軟件計量分析工具,集計算機技術、網絡技術、計量學方法、統計學方法於一體,其應用範圍覆蓋了所有基於網絡通信技術的信息測度。網絡計量學是綜合採用文獻計量、信息計量、統計學方法、計算機技術和網絡技術對網絡文獻規律進行統計分析的一門科學。網絡信息計量學是採用數學、統計學的各種定量方法,對網絡信息的組織、存儲、分佈、傳遞、相互引證和開發利用進行定量描述和統計分析,藉以揭示網絡信息的數量特徵和內在規律的一門新興學科。它主要是由網絡技術、網絡管理、信息資源管理與信息計量學等相互結合、交叉滲透而形成的一門交叉性邊緣學科。

2 鏈接分析法研究現狀

2.1 鏈接分析法的內容

鏈接分析法是網絡信息計量學中一個重要方法,它可以看成是文獻計量學中引文分析法在網絡環境中的應用。網絡超文本通過鏈可以將結點鏈接起來,一般使用兩種方法——索引鏈和結構鏈進行鏈接,它既可以表示信息之間的關係,又是構成網絡的手段。在將網絡相關信息資源內容鏈接起來形成新的信息鏈或信息集合的基礎上,融合了參考文獻鏈接功能,並通過引文關係來分析鏈接網絡信息資源的方法。可以按照引用程度和引用權威信息源來分析,在網絡信息組織、檢索、評價、服務等方面起着重要作用。

2.1.1 鏈接分析法在網絡信息組織方面的作用

網絡信息資源生產者如網頁創作者使用鏈接分析,創建一些對訪問者有用的鏈接,可以鏈接到不同主題或相同主題質量更優秀的網頁。一般來説鏈接類型大致有:合作鏈接(被鏈接網站和鏈接網站之間存在合作關係)、友情鏈接(網站之間可能由於在資源或其它相關方面有關係,相當於影視術語中的友情客串)、推薦鏈接(被推薦網站由於質量好、人氣旺、訪問用户多或是熱門網站等原因鏈接)、內容鏈接(被鏈接網站和鏈接網站在內容上存在着互補或相通關係等),可以起到網絡導航的作用,大大方便用户在網上衝浪。Google還通過鏈接分析來確定網絡上的權威信息源來進行相關的排名。Google認為網頁製作者僅創建他們認為重要的網頁的鏈接,鏈接到另外的網頁就像一本書的引文,網頁之間的這種引文關係“像是對網頁進行評論的過程”。例如,網頁的製作者們創造了幾千個Yahoo的鏈接,困此Yahoo被當作一個重要程度點;如果許多重要的網頁都指向Yahoo,則其重要程度會更高。這種方法的好處是網頁製作者不可能誤導網站的排序,並且擴展性極好——當網絡增長時,產生更多的重要網頁的鏈接,自然更能確定該網頁是否是權威的信息源。

2.1.2 鏈接分析法在網絡信息檢索方面的作用

鏈接分析主要應用於網絡信息檢索方面,如搜索引擎收集信息、檢索結果的排序等。網絡信息檢索為用户提供海量信息多媒體數據庫,採用超文本技術使檢索空間比傳統的信息檢索範圍更廣泛,以結點為單位組織,以超鏈接的方式鏈接相關內容,更加符合人們的思維方式,打破了線性存儲的限制,真正實現多維檢索。Web信息檢索系統可以利用鏈接信息來優化對相關文獻的查詢,能夠極大地提高檢索結果的相關性。在搜索引擎收集信息的過程中,nberg認為搜索引擎的Robots直接訪問Web提取出權威頁(AuthorityPage)。但是如何提取出權威頁,這需要一個原始積累和評價過程。先給出一批起始網頁,Robot從這些源網頁開始收集,可以按照深度優先或廣度優先的算法進行。當網頁提取回來後,採用鏈接分析技術(具體用遞歸算法)來計算出權威頁。有了權威網頁,Robot在收集Web信息時,就有針對性地、高效率地訪問Web網頁。搜索引擎檢索結果排序方面也運用了鏈接分析技術,由於索引數據庫容量大,若用户輸入一個關鍵詞,有可能會有成千上萬條記錄相匹配,搜索引擎對如此龐大的結果如何排序,如何把最相關的幾十條記錄顯示出來?搜索引擎按記錄號的順序提取結果集中的前幾十條記錄,再按鄰近圖(NeighborGraph)算法對這幾十條記錄排序,最先顯示給用户。這種檢索結果排序就是利用鏈接分析技術,大大減輕了搜索引擎的負擔,Yahoo、Google等搜索引擎就採用了超鏈接分析技術來對檢索結果排序。2.1.3 鏈接分析法在網絡信息資源評價方面的作用

傳統的引文分析法在學術方面衡量學術期刊重要性的指標之一是“影響因子”(IF),哪家期刊和論文被引用次數多,影響因子就高,誰就被認為是權威,論文也就是優秀論文。在互聯網上IF對應於統計指向某一網頁的鏈接數目後對該網頁作出的排序,網站引用分析對應的是某個站點網頁被其它站點引用的情況的統計分析,也就是網頁可能被其它網站搜索提問命中的結果數的多少,採用計分法和線性代數方法對中心網頁和權威網頁分數進行迭代求和,以確定權威網頁和中心網頁。這與百度搜索引擎的創始人李彥宏1996年提出的搜索引擎的第二定律:“人氣質量定律”相一致。根據這一定律,用鏈接分析法進行統計網站被鏈接和訪問次數,可以作為評價網站和網絡信息資源質量的一個指標。再加上相應的鏈接文字分析,就可以用在搜索結果的排序上了,對搜索結果進行的按相關性排序,不完全依賴於詞頻統計,而是更多地依賴於超鏈分析。在Internet上鍊接關係反映的是網頁在全世界範圍內、同一學科類屬的影響力,評價範圍是很廣的、甚至全球性的。目前主要利用搜索引擎工具在網絡上檢索網站和網頁的鏈接情況,並按相關性對檢索結果進行排序,大大方便了用户在浩

翰的信息海洋中迅速準確地獲得有用的信息,易於操作、實用且可以節省用户的時間,在一定程度上可以彌補同行評議等定性方法的缺陷。

2.2 鏈接分析法對情報學研究方法的意義

蘇聯科學家巴甫洛夫説過:“科學是隨着研究方法所取得的成就向前的。研究方法每前進一步,隨之我們面前也就開拓了一個充滿種種新鮮事物的更遼闊的.遠景。”情報學是一門新興的綜合性邊緣學科,是一個開放的綜合性知識體系,它善於吸收其它相關學科的知識和研究方法。上世紀60年代後,隨着科學的日益發展,科學研究中應用研究、實用研究和開發研究比重逐漸增大,情報學研究方法體系取得了長足進步,表現在:一是情報研究的領域、對象、內容等的擴大和深化;二是現代科學學科與方法的創立和發展。情報學研究方法體系是動態的、發展的。情報學科要想在原有的基礎上實現學科研究模式的更新

、學科結構的變革和學科體系的拓展,就必須研究和採用新的思維方式和新的研究方法,及時反映最新的學科學術動態和最新的理論學説,移植、借鑑其它學科的研究方法,如哲學方法、數學方法、社會學方法、經濟學方法、信息技術方法等來豐富自己的研究方法,並加以創造和大膽創新,不僅引起自身學科結構的變革和深化學科前沿的研究,而且不斷髮展新的分支學科,促使學科研究充滿時代氣息。

鏈接分析法大大拓展了信息計量學在網絡環境下的應用,充實了網絡信息計量學的內容,是情報學研究的新領域,完善了情報學方法論體系。它是情報學逐漸成熟的一個重要歷程碑,標誌着情報學理論方法的一個新的飛躍。

2.3 鏈接分析法目前存在的問題

在文獻計量學中,傳統的引文分析法只要統計參考文獻數據就可完成引文分析的任務,但是在互聯網上,鏈接分析法的研究對象是網絡信息資源,網絡信息資源覆蓋範圍廣、動態性強,具的信息量巨大、不確定性、缺乏合理組織、難以預測等特點,且信息過載(InformationOverload)和信息污染(InformationPollution)現象嚴重;引用與被引用關係也變得十分複雜;鏈接分析法的適用範圍也是有限的;Internet是在一個商業化的環境中發展起來的,一個網站的被鏈接數量還與它的商業推廣有着密切的聯繫,因此這種評價體制在某種程度上缺乏客觀性。因此,在使用鏈接分析法時要充分考慮以上問題,盡大可能保證其結果的可靠性。

3 結束語

由於鏈接分析法借鑑了引文分析法的方法和思路,是情報學研究方法在網絡環境下新應用,目前鏈接分析法主要實驗工具是搜索引擎,但隨着網絡信息技術如人工智能、網絡信息檢索、計算機網絡、知識挖掘、自然語言處理等的發展,必將為鏈接分析法的研究和開發應用提供更為有力的支持。情報學也必將充分利用網絡信息技術,吸收其它學科的先進方法來深化、完善自己的方法論體系,建立起更為完善的體系結構,從而改變情報學學科的面貌。

【參考文獻】

1 徐久齡等.網絡計量學的研究.情報學進展1998-1999年度評論,第三卷.北京:航空工業出版社,1999:78-105

2 夏旭等.網絡計量學研究:現狀、問題與發展.圖書館論壇,2001,(12):44-47

3 鄒志仁.論情報研究方法體系.江蘇圖書館學報,1990,(2):18-23

4 楊濤.鏈接分析法存在的問題及改進方法.圖書情報知識,2002,(3):62-63

5 劉雁書,方平網站站外鏈接類型與特徵調查-鏈接分析法可行性研究.大學圖書館學報,2001,(5):65-68

6 鄒菲.試論網絡信息計量學在數字圖書館中的應用.圖書情報知識,2001,(1):16-17,20

7 邱均平.信息計量學(一).情報理論與實踐,2000,(1)

8 鄒曼莉.國外網絡信息檢索的最新進展.圖書館雜誌,2002,(2):67-70

9 reteAlgorithm,ork.1998

  • 文章版權屬於文章作者所有,轉載請註明 https://wenshudu.com/shiyongfanwen/lunwen/dpkx4v.html
專題