微眾銀行:使用圖數據庫進行全局數據血緣治理
微眾銀行是中國首家民營銀行,目前個人客戶已突破 2.5 億人,企業法人客戶超過 170 萬家。微眾銀行基于悅數圖數據庫搭建全行級圖平臺,并將圖指標、圖計算納入風控策略,深度探索潛在的交易風險。
業務挑戰:互聯網交易數據指數級增長,原有數據庫性能不足
為了應對業務的擴展和數據來源的增長以及指數級增長的互聯網金融交易風險,微眾銀行建立了內部一站式大數據管理平臺 WeDataSphere。其基礎平臺由數據交換、數據分發、計算、存儲四大層次組成,關注底層數據傳輸計算存儲能力;功能平臺由平臺工具、數據工具、應用工具三大層次組成,關注用戶各類功能工具需求實現,從而形成完整的大數據平臺技術體系,能夠提供一站式的豐富數據平臺組件及功能支撐。
但早期圖數據庫系統性能較差,且依賴的其他數據組件較多,運維成本偏高,為提升圖數據分析處理的性能和可靠性,計劃對當前的圖數據庫系統進行架構優化。
選擇悅數圖數據庫:
建設數據平臺分析數據血緣及影響范圍

經過測試相較于同類競品,「悅數圖數據庫」的查詢和導入性能都更優秀。比如 60 萬個點、百萬級別邊這個場景的情況,在單節點低配機器部署情況下,微眾銀行導入數據基本上在 20 分鐘內完成,說明悅數的寫入性能非常好。
微眾銀行在圖數據庫選型時有一個重量考核點:高可用和容災的架構支持。悅數圖數據庫采用分布式設計,支持分集群部署模式,具備存儲和計算的橫向擴展能力,更加符合銀行場景下的分布式和高可用要求。另外,大數據平臺本身旨在構建一個完整的數據流生態,悅數提供了豐富的大數據生態工具,包括 Spark/Flink 數據連接器、數據遷移工具等,提供了和大數據平臺數據流結合的能力。
應用場景:
應用場景 1:血緣數據實時查詢
通過建立數據資產目錄,指引數據的獲取、訪問和使用,輔助數據資產的有效利用,實現數據資產安全管理。具體操作來說,可以以某個表為起始節點遍歷得到上游表和下游表;服務端通過悅數圖數據庫的 Java 客戶端連接到悅數圖數據庫查詢即可得到血緣關系。
應用場景 2:血緣數據批量分析
以某個租戶、某個部門的表、某個產品的表為起始節點批量分析得到這些表的上游表和下游表的完整鏈路;大數據任務通過悅數 Spark 連接器將點數據和邊數據批量導入悅數圖數據庫,再使用基于 GraphX 的算法批量分析得到完整的血緣鏈路。

以上圖為例,藍色表為中心數據,通過微眾的數據平臺可以查詢下游的一度關系表和上游的一度關系表。同時大數據平臺構建圖數據庫數據模型時加入了時間屬性,因此可以查詢特定時間,比如:某張表昨天到今天的血緣關系,用戶可基于時間維度進行數據過濾和檢索。
使用收益:平臺數據治理能力全面提升
通過此次升級,微眾銀行對大規模數據處理能力得到全面提升。悅數圖數據庫具備較強的讀寫平衡能力,同時能達到每秒百萬行級的導入能力,實現了數據血緣場景下的實時和批量查詢的要求。
其次,悅數圖數據庫采用存算分離的分布式架構,具備較好的計算和存儲層橫向擴展能力及金融級高可用能力,能夠滿足數據和業務動態擴縮容要求,確保集群運行穩定。目前全行 AIOps 都已經接入悅數圖數據庫平臺。