技能分享 | 如何建置「金融知識圖譜」

建置金融知識圖譜

在建構一個完整的金融知識圖譜前,我們需要先收集多方面的資料源來降低誤差率,目前可以收集的資料源包括這四大類:結構化資料源(如銀行、政府機構、股票)、非結構化資料源(如網路媒體、信用報告、融資規劃報告)、內部資料源(客戶基本資料、信貸資料、交易紀錄、訂單採購資料)以及外部資料源(如新聞、雜誌、論壇)。

從這些資料源中獲得實體、關係以及實體屬性,接著透過知識融合、儲存以及理解,消除實體與實體間的錯誤訊息,並發現實體間的關係後,同時運用機器學習、自然語言處理,AI人工智慧等技術,建構出「金融知識圖譜」。

知識圖譜建建置流程圖

客戶基本資料與金融業的關係

在上述提到資料源中,客戶基本資料在建置金融知識圖譜是最不可或缺的資料之一,原因在於客戶基本資料與金融業之間的緊密關係。近年由於多起國內與國際間銀行因反洗錢防制不完善遭到巨額裁罰案,因此開始加強預防、監控、通報三大部分。而客戶的調查,也就是了解您的客戶(Know Your Customer)盡職調查是首要的預防措施。為了強化金融安全,我們需要落實「實名制」認證,因此金融機構會要求客戶提供具體的資訊,來確認客戶的真實性。比如說我們去銀行開戶時,被要求提供身分證件來證明是本人,這就是日常中最初步的KYC。

SourceZones 團隊經過多年的經驗,透過整合多方資料源,運用獨家 Machine Learning 及自然語言理解技術,降低資料比對誤判率,搭配知識圖譜等技術,提供最佳的分析系統。協助金融機構對客戶進行了解和審核,協助識別客戶身份、股權關係、新聞資訊等。並對客戶關係進行審查,落實客戶監控與反洗錢防制,以及可疑交易進行回報。

自然人資料建置

將蒐集到的資料源,做機器學習、自然語言處理,AI人工智慧處理及資料清洗,再透過資料整合後,利用與法人有關聯的資料庫,將與自然人相關的關聯建立出「自然人圖譜演算模型」。

自然人資料建置關聯圖

法人資料建置

將蒐集到的資料源,做機器學習、自然語言處理,AI人工智慧處理及資料清洗,再透過資料整合後,利用與法人有關聯的資料庫,將與自然人相關的關聯建立出「法人圖譜演算模型」。

法人資料建置關聯圖

建構模型解析

1、風險控管模型

在客戶、企業、行業間建立起緊密關聯的知識圖譜,從行業關聯中進行風險的預測。通過對行業進行分析及調查,根據貸款訊息、行業訊息建立關係挖掘,也可以及時發現風險關聯的企業客戶。

風險控管模型圖

2、金融知識圖譜經營銷售模型

透過知識圖譜可以整合多個資料源,建立關於潛在客戶的完整知識認知。針對自然人客戶,知識圖譜通過其個人愛好、交易資料記錄、社交網站資料等,分析客戶行為,挖掘客戶潛在需求,進行評估提供服務。例如,分析「客戶之間的關係」,發現部分客戶擁有共同愛好,針對性地對特定族群制定經營銷售的策略。針對法人客戶,知識圖譜通過分析法人基本資料、投資關係、任職關係、專利資料、訴訟資料、新聞報導等,對法人進行知識建構。

金融知識圖譜經營銷售模型圖

SourceZones 如何建置知識圖譜?

知識圖譜本質上是一種語意網路,最主要的特點是「滿滿大平台」的資訊語意網路,以實體概念或詞彙代表節點(vertex),以關係代表邊(edge)。透過無數的節點和邊組成,每個節點代表一個實體。每條邊為實體與實體之間的關係,進而達到『面』的資訊關聯呈現。

SourceZones 整合各類的資料源,運用獨家的「機器學習」及「人工智慧」進行事件類型識別。將識別好的事件和關聯主體跟知識圖譜做關聯,再利用「知識圖譜」深度挖掘法人的關聯關係。以特定法人為起點,直觀地展示企業在多元的資料維度中連結人物、事件、地點和時間等資訊的整體關聯關係。將繁雜散落的資訊梳理成一目瞭然的圖譜,也就是我們的「知識圖譜關聯圖」。

SourceZones 團隊在這三年來累積豐富的實務經驗,打造出領先的技術架構,並持續針對市場需求做優化。以提供完善的分析系統給企業使用,並評估回報有風險的資訊,達到以下幾個特點:

  • 強化客戶歷史背景認知
  • 上下關係分析與探尋業務市場機會
  • 監控突發市場新聞加強銀行反應能力
  • 日夜監控外部資訊及演算分析關係圖譜

相關文章:

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s