知識圖譜分為通用知識與領域知識圖譜兩類,兩類圖譜本質相同,其區別主要體現在覆盖範圍與使用方式上。
- 通用知識圖譜:可以形象地看成一個面向通用領域的結構化知識庫,其中包含了大量的嘗試性知識,覆蓋面積廣。
- 領域知識圖譜:又可稱為行業知識圖譜或垂直知識圖譜,通常面向某一特定領域,可以看成是一個基於語義技術的行業知識庫,有著嚴格而豐富的數據模式,所以對該領域知識的深度、知識準確性有著更高的要求。
通用知識圖譜應用
由于現今的知識豐富多樣且複雜,通用知識圖譜主要强调知識的廣度,通常運用百科數據進行自底向上(Top-Down)的方法進行建構。
領域知識圖譜應用
如圖1.1所示,領域知識圖譜常常用来輔助各種複雜的分析應用或决策支持,在多個领域均有應用,不同領域的構建方案與應用形式則有所不同。
本文章將以電子商務、圖書情報、企業商業、創業投資、生物醫療等五個領域為例,從圖譜構建與知識應用兩個方面介紹領域知識圖譜的技術構建應用與研究現況。

金融證卷

圖書情報

政府機構

生物醫療

電子商務

雜誌出版社
圖1.1 各行業知識圖譜應用
- 電子商務:
現今,電商的規模巨大,對我們每個人的生活都有影響。因而電商知識圖譜這個垂直知識圖譜非常重要。
電商知識圖譜以商品为核心,以人、貨、場為主要框架。這個商品「大脑」的一個應用場景就是導購。而所谓導購,就是讓消費者更容易找到他想要的东西,比如說買家輸入 “ 我需要一件漂亮的絲巾 ”,“ 商品大腦 ” 會通過語法詞法來取語意要點中關鍵詞,從而幫買家搜尋到合適的商品。
再者,電商平台管控從過去的巡檢模式升級為發度端逐一檢查。在海量的商品發布量的挑戰下,最大可能地借助大數據、人工智能阻止壞人、問題商品進入電商生態。為了最大限度地保護知識產權,保護消費者權益,電商知識圖譜推理引擎技術滿足了智能化、字學習可解釋等更高地技術要求,實現了良好的社會效益。
- 圖書情報:
圖情知識圖譜是指聚焦某一特定細分行業,以整合行業內資源為目標的知識圖譜。提供知識搜索、知識標引、決策支持等型態的知識應用,服務於行業內的從業人員,刻記研發機構及行業決策者。
在信息高度共享和開放的時代背景下,近年來國內外博物館以及文化遺產領域,正在完成由專有數據資源和私有數據資源到公共開放關聯數據的轉變。
其中較為典型的博物館領域知識圖譜項目,以大英博物館知識圖譜項目為例。大英博物館是最早使用知識譜圖技術的博物館之一。2011年,它將文物數據映射到本體CIDOC-CRM上,共發佈了1億條三元組,並將數據連結到世界範圍的知識譜圖上,在此基礎上開發了語義檢索系統。
- 企業商業:
企業知識圖譜通過異常關聯挖掘、企業風險評估、關聯探索、最終控制人和戰略發展等方式為行業客戶提供智能服務和風險管理。
異常關聯挖掘是通過路徑分析、關聯探索等操作,挖掘目標企業譜系中的異常關聯。
基于企業知識圖譜從多維度構建數據模型可以進行全方位的企業風險評估,有效規避潛在在的經營風險與資金風險。
- 創業投資:
創業投資知識圖譜聚焦於工商知識圖譜的一部分數據内,創投領域知識圖譜主要應用型態包括知識檢索以及可視覺化決策支持。
知識檢索茲托創投知識圖譜可以在原有知識全文搜索的基礎上實現語義搜索與智能問答的應用型態。其中,語義搜索提供自然語言式的搜索方式,由機器完成用戶搜索意圖識別。
而作為知識搜索的終極型態,智能問答允許用户通過對話的方式對領域內知識進行問交互,同時通過問題模板實現業務問題的回答。
- 生物醫療:
隨著技術不斷地進步,採用理論研究與實證分析、應用研究相結合的方式,在收集大量資料與數據、閱讀文獻的基礎上書裡和總結的醫學管理與決策理論,以及大數據管理的分析方法,在醫療知識圖譜上已經實現。