技能分享 | 「知識圖譜」在金融業真的需要嗎?

隨著大數據時代的到來,各行各業使用數據的方式都發生了巨大的變化。

在金融產業當中,數據資料是十分重要的資源,如何突破既有的數據使用模式,更加高效、精準、迅速地獲得數據帶來的價值,是金融機構一直以來關注的問題。

利用基於關聯關係的知識圖譜概念,可以突破現有的關係型資料庫的限制,知識圖譜將通過發掘實體之間的關聯,將半結構化、非結構化的數據整合,幫助我們理解數據、解釋現象、知識推理,從而發掘深層關係、實現智慧搜索與智能交互,在金融行業中讓數據發揮更大的價值。

分別在語義搜索、智能問答、視覺理解、數據分析等方面做探索。基於知識圖譜,機器獲取到的不再是無關聯的信息,而是可以把這些信息映射到各種各樣的實體、概念,從而建立機器自己的認知世界。在知識圖譜的探索過程中,我們將逐步解決數據結構、數據質量以及核心算法的問題。

什麼是知識圖譜?

知識圖譜是一種大規模語義網絡,更是一種基於圖的數據結構,由節點和邊組成,可以建構龐大的知識網絡,包含客觀世界存在的大量實體、屬性以及關係,為人們提供一種快速便捷的方式,進行知識檢索與推理。

在知識圖譜裡,每個節點表示現實世界中存在的「實體」,每條邊為實體與實體之間的「關係」。簡單來說,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關係網絡。知識圖譜提供了從「關係」的角度去分析問題的能力,是關係表示最有效的方式之一。

近年來蓬勃發展的人工智能是一次知識革命,其核心在於通過數據觀察與感知世界,實現分類預測、自動化等智能化服務。知識圖譜作為人類知識描述的重要載體,推動著信息檢索、智能問答等眾多智能應用。

解決金融行業什麼問題?

為什麼各個行業突然開始使用知識圖譜呢?這是因為,傳統行業的自有數據遠遠不能刻畫出複雜又隨時變化的真實世界。

在金融行業走入信息化、進入大數據時代,注重在提高效率,即如何突破既有的數據使用模式,更高效、精準、迅速地獲得數據帶來的價值。

而進入智能化後,新的商業模式應運而生,產生重構式變革。這時期的重心更多的是由知識圖譜等人工智慧技術來支持。未來幾年金融行業的重點之一便在於此,利用基於關聯關係的知識圖譜概念,可以突破現有的關係型資料庫的限制,在金融行業中讓數據發揮更大的價值。

金融領域的場景應用

在重構金融行業業務流程過程中,知識圖譜的應用場景很多。

首先是金融行業兩大核心業務是:營銷和風控,即最大限度的獲取更多的營銷收益,並在充滿風險的市場上做好風控管理。這些業務核心,都離不開用戶本身的個人信息和數據。

營銷類應用

  • 挖掘潛在客戶:

挖掘潛在客戶一直是金融行業關注的一項重要應用,通過現有數據和外部數據精準、迅速地找到相關業務的潛在客戶,對於銀行業務的提升會起到較大助益。我們可以基於現有銀行客戶建立社交網絡知識圖譜,根據不同的交往方式和頻次定義圖譜的關係模型。

對客戶的親屬、朋友、同事、同學、陌生人等進行相關的社交挖掘,評估關係緊密度。比如,基於現有VIP客戶,挖掘相關聯繫人及其愛好,或可以在現有客戶中去發現具有共同愛好的一個組織,從而可以有針對性地對某一部分或一類人群制定營銷策略。

  • 深挖客戶潛在需求:

除了挖掘潛在客戶外,我們也需要挖掘現有客戶的需求,針對他們的特點及需求推送相關產品。

當我們建立好一個基於銀行客戶關係的知識圖譜系統後,可以進行彈性擴展,如增加車輛信息、個人愛好、行為等。結合多種數據源,更加精準地分析客戶行為,了解客戶潛在需求,進行精準推送。

風控類應用

  • 反欺詐應用:

在反欺詐領域,知識圖譜同樣有適當的應用場景。在近幾年,金融欺詐的形式越來越多種且多樣,包括提供虛假資料,團伙欺詐,內外勾結等手法。

在這種情況下,原來通過單點突破進行反欺詐的方法已經遠遠不夠,我們需要建立起一個積極有效的知識圖譜。首先需要把與借款人相關的所有的數據源打通,並構建包含多數據源的知識圖譜,從而整合成為機器可以理解的結構化數據。我們不僅可以整合借款人的基本信息,還可以把借款人的消費記錄、行為記錄、關係信息、線上日誌信息等整合到反欺詐知識圖譜里,從而進行分析和預測。

除了申請階段的反欺詐,通過構建已知欺詐要素(手機、設備、帳號、地域等)的關係圖譜,全方位了解客戶海量風險數據的離線統計分析,按主題要素收集風險運營的結果反饋,建立客戶風險特徵信息庫,優化風險模型和規則,還能做到交易階段的反欺詐。

  • 反洗錢應用:

在反洗錢領域,我們可以幫助監管部門進行有效的監控,通過對關係帳號進行逐級挖掘,可以找到隱藏在背後的洗錢帳號。

相比單獨帳號、關係的識別,這種組織往往隱藏在在非常複雜的關係網絡中,很難被發現。我們只有把其中隱含的關係網絡梳理清楚,同時從時間、空間多維角度進行分析,才能識別潛在的風險,發現隱藏的反洗錢團隊。

預測類應用

  • 潛在風險行業預測:

基於多維度數據庫,我們可以在客戶、企業、行業間建立起緊密關聯的知識圖譜,從行業關聯的維度預測風險。

通過對行業進行分析及調查,根據貸款信息、行業信息建立關係挖掘模型,並通過機器學習(註解1)進行模型的訓練,可展示每個行業及與其關聯度最高的幾個行業,如果某一行業發生了行業風險或高風險事件,我們可以及時預測未來有潛在風險的關聯行業,金融機構從而可對相關行業的風險做出預判,儘早地發現並規避風險。

  • 潛在風險客戶預測:

通過建立客戶、企業、行業的知識圖譜,也可以將行業和企業之間數據進行連接,基於對行業的潛在風險預測,及時發現行業風險、系統性風險相關聯的企業客戶。比如某省最近某行業的連續出現了多筆逾期貸款,通過對行業和客戶的知識圖譜進行分析,我們也可以及時發現可能位於關聯行業,也有可能位於上下游潛在的其他存在潛在風險的客戶。

註解1:機器學習因機器更能讀懂客戶,還可以深挖客戶潛在需求,針對他們的特點推送相關產品。甚至針對企業級客戶,還能分析企業級客戶的資金關係、法人關係、上下游投資關係、相似企業業務關係等,為企業推薦合適產品、服務。

結論

現今各產業都非常重視的預防系統性金融風險,通過建立客戶、企業、行業的知識圖譜,也可基於對行業的潛在風險預測,及時發現行業風險、系統性風險相關聯的企業客戶。

就像知識圖譜最先應用於搜索,在資訊上同樣適用。傳統的搜索結果基於網頁端,搜尋引擎不知道含義只能羅列出和目標關鍵詞匹配的頁面地址。知識圖譜能夠理解用戶的閱讀興趣和理解資訊內容,並對二者進行匹配,從而為用戶進行「智能推薦」。

擁有知識圖譜,可以幫助其找到更多場景化的產品應用,就能將金融科技推到一個新高度。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s