當前位置:文書都 >

行政公文 >報告 >

1978年到2017年政府工作報告關鍵詞盤點

1978年到2017年政府工作報告關鍵詞盤點

3月5日,第十二屆全國人民代表大會第五次會議在北京人民大會堂開幕。國務院總理李克強作政府工作報告。澎湃新聞()整理了中國政府網上1978年至2017年共計40份《政府工作報告》中的常青詞彙。結果顯示,“發展”、“建設”、“經濟”、“改革”等詞語在過去40年中一直高頻出現。

1978年到2017年政府工作報告關鍵詞盤點

還有部分詞語愈發頻繁地出現在《政府工作報告》中。“創新”,1997年後開始被頻頻提起,因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”,類似的詞語還有“就業”、“創業”、“民生”等。

澎湃新聞還對比了部分關鍵詞在這40年間的趨勢變化,“農業”與“工業”相比,在近四十年裏被提及狀況相對穩定,這與長期以來三農問題備受重視的現象相關。2000年以來,“製造業”與“服務業”幾乎同時開始被提及,但是“服務業”的被提及率幾乎都高於“製造業”。

有些詞雖然在《政府工作報告》裏出現得少,但是他們首次出現的時間點都反映了當年中國人關注的熱點問題。

————————————

分析方法:

1.本文所有原始文本材料來自中國政府網1978年至2017年政府工作報告。

2.本文使用jieba分詞(),其自稱”做最好的. Python 中文分詞組件“。採用精確分詞模式,避免重複分詞和歧義。分詞結果均去掉數字、單字、標點符號。

3.為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。

4.在分詞基礎上,採用TF-IDF加權技術。詞語的重要性隨着它在文本中出現的次數成正比增加,但同時會隨着它在語料庫中出現的頻率成反比下降。本文使用的語料庫即1978年至2017年政府工作報告文本。

5.涉及合併的詞語:反腐包括了反腐倡廉、反腐敗、腐敗、反腐;城鎮包括了城市、城鎮;霧霾包括了PM2.5、霧霾。

標籤: 關鍵詞 報告 政府
  • 文章版權屬於文章作者所有,轉載請註明 https://wenshudu.com/xingzhenggongwen/baogao/4kevgq.html
專題