Graph + LLM 實(shí)踐指南|如何使用自然語(yǔ)言進(jìn)行知識(shí)圖譜構(gòu)建和查詢
隨著 ChatGPT 等 AI 智能應(yīng)用在全球范圍內(nèi)的風(fēng)靡,大語(yǔ)言模型技術(shù)(Large Language Model,簡(jiǎn)稱 LLM)受到各行業(yè)企業(yè)和個(gè)人用戶的廣泛關(guān)注。圖數(shù)據(jù)庫(kù)憑借圖形格式組織和連接信息的方式,能夠幫助大語(yǔ)言模型更好地理解實(shí)體間的關(guān)系,提升自己的表達(dá)和推理能力。那么,大語(yǔ)言模型與圖技術(shù)在具體應(yīng)用領(lǐng)域又能碰撞出怎樣的火花呢?
經(jīng)過(guò)悅數(shù)研發(fā)團(tuán)隊(duì)的努力和與國(guó)際多家知名大語(yǔ)言模型 LLM 技術(shù)團(tuán)隊(duì)的合作,目前悅數(shù)圖數(shù)據(jù)庫(kù)的產(chǎn)品已經(jīng)可以實(shí)現(xiàn)基于 Graph + LLM 技術(shù)的 Text2Cypher,即自然語(yǔ)言生成圖查詢。用戶只需要在對(duì)話界面中通過(guò)自然語(yǔ)言就可以輕松實(shí)現(xiàn)知識(shí)圖譜的構(gòu)建和查詢,更有開(kāi)箱即用的企業(yè)級(jí)服務(wù),歡迎大家在文末點(diǎn)擊試玩體驗(yàn)新一代的悅數(shù)圖數(shù)據(jù)庫(kù) x 知識(shí)圖譜應(yīng)用吧!
作為圖技術(shù)領(lǐng)域最常見(jiàn)應(yīng)用之一,知識(shí)圖譜以點(diǎn)-邊形式的圖結(jié)構(gòu)組織和表示知識(shí),不僅可以用于表示實(shí)體(如人、地點(diǎn)、事件、概念等)之間的關(guān)系,還包含這些信息之間的語(yǔ)義含義,以一種結(jié)構(gòu)化的方式生動(dòng)描述現(xiàn)實(shí)世界中的知識(shí),使得計(jì)算機(jī)能夠理解和推理這些知識(shí),被廣泛應(yīng)用于風(fēng)險(xiǎn)控制、生產(chǎn)制造、藥物研發(fā)、科研探索等領(lǐng)域。
顧名思義,Text2Cypher 做的就是把自然語(yǔ)言的文本轉(zhuǎn)換成 Cypher 查詢語(yǔ)句。一直以來(lái),阻礙圖數(shù)據(jù)庫(kù)、知識(shí)圖譜被更廣泛應(yīng)用的因素之一就是查詢圖數(shù)據(jù)庫(kù)的技術(shù)門檻。那么,在沒(méi)有大語(yǔ)言模型的時(shí)候,我們是怎么做的呢?
傳統(tǒng)的 Text2Cypher
文本到查詢的這個(gè)領(lǐng)域在大語(yǔ)言模型之前就一直存在這樣的需求,一直是知識(shí)圖譜最常見(jiàn)的應(yīng)用之一,比如 KBQA(基于知識(shí)庫(kù)的問(wèn)答系統(tǒng))的系統(tǒng)內(nèi)部本質(zhì)上就是 text2cypher。
當(dāng)一個(gè)問(wèn)題語(yǔ)句發(fā)送過(guò)來(lái)之后,它首先要做意圖識(shí)別(Intent)、實(shí)體識(shí)別(Entity),然后再利用 NLP 模型或者代碼把相應(yīng)的意圖和實(shí)體構(gòu)造成知識(shí)圖譜的查詢語(yǔ)句,最終查詢圖數(shù)據(jù)庫(kù),并根據(jù)返回結(jié)構(gòu)構(gòu)造答案。
可以想象,讓程序能夠:
- 從自然語(yǔ)言中理解意圖:對(duì)應(yīng)到哪一類支持回答的問(wèn)題
- 找出實(shí)體:?jiǎn)栴}中涉及到的主要個(gè)體
- 從意圖和實(shí)體構(gòu)造查詢語(yǔ)句
不可能是一個(gè)容易的開(kāi)發(fā)工作,一個(gè)真正能夠落地的實(shí)現(xiàn)要訓(xùn)練的模型或者實(shí)現(xiàn)的規(guī)則代碼所考慮的邊界條件可能非常多。
大語(yǔ)言模型實(shí)現(xiàn)的 Text2Cypher
而在”后大語(yǔ)言模型“時(shí)代,這種從前需要專門訓(xùn)練或者寫規(guī)則的”智能“應(yīng)用場(chǎng)景成了通用模型+提示工程(Prompt Engineering)就能完成的任務(wù)。
注:提示工程指通過(guò)自然語(yǔ)言描述,讓生成模型、語(yǔ)言模型完成”智能“任務(wù)的方法。
為此,悅數(shù)圖數(shù)據(jù)庫(kù)經(jīng)歷了一系列研發(fā)驗(yàn)證工作,最終實(shí)現(xiàn)了大語(yǔ)言模型與圖查詢語(yǔ)言表達(dá)的對(duì)接。用戶在提出任務(wù)的時(shí)候,只需要使用自然語(yǔ)言,就可以實(shí)現(xiàn) Schema 獲取、Cypher 語(yǔ)句生成的 Prompt、各種大語(yǔ)言模型(LLM) 的調(diào)用、結(jié)果的處理,真正實(shí)現(xiàn)了無(wú)需代碼、開(kāi)箱即用的知識(shí)圖譜構(gòu)建和查詢方案。
通過(guò)悅數(shù)圖技術(shù)與大語(yǔ)言模型的結(jié)合,企業(yè)用戶可以輕松實(shí)現(xiàn)知識(shí)圖譜的構(gòu)建和查詢。不僅可以以較低的費(fèi)用成本完成高準(zhǔn)確性的查找和直觀的可視化呈現(xiàn),而且不再需要長(zhǎng)時(shí)間的學(xué)習(xí)投入才能掌握從圖中獲取重要洞察的方法了。
和上一代知識(shí)圖譜相比,悅數(shù)圖數(shù)據(jù)庫(kù)和大模型的結(jié)合,能夠讓企業(yè)以更低成本更便捷地構(gòu)建基于海量數(shù)據(jù)的知識(shí)圖譜。同時(shí),用戶能直接使用自然語(yǔ)言進(jìn)行交互式提問(wèn)和查詢,降低企業(yè)使用門檻,用戶學(xué)習(xí)成本更低。
[免責(zé)聲明]
原文標(biāo)題: Graph + LLM 實(shí)踐指南|如何使用自然語(yǔ)言進(jìn)行知識(shí)圖譜構(gòu)建和查詢
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。



