大語(yǔ)言模型在企業(yè)內(nèi)部審計(jì)中的實(shí)踐分析

在當(dāng)前的企業(yè)環(huán)境中,內(nèi)部審計(jì)面臨著數(shù)據(jù)量大、業(yè)務(wù)復(fù)雜度高等挑戰(zhàn)。隨著人工智能技術(shù)的發(fā)展,特別是大語(yǔ)言模型(LLM)的應(yīng)用,企業(yè)內(nèi)部審計(jì)的實(shí)踐正在經(jīng)歷一場(chǎng)革命性的變化。以下是對(duì)大語(yǔ)言模型在企業(yè)內(nèi)部審計(jì)中應(yīng)用的深度剖析。
技術(shù)概覽與應(yīng)用場(chǎng)景
大語(yǔ)言模型,以其強(qiáng)大的文本處理能力和深度學(xué)習(xí)算法,正在被廣泛應(yīng)用于企業(yè)內(nèi)部審計(jì)的多個(gè)方面:
- 審計(jì)知識(shí)智能問(wèn)答:通過(guò)構(gòu)建審計(jì)知識(shí)庫(kù),大模型可以快速準(zhǔn)確地回答審計(jì)人員的問(wèn)題,提供業(yè)務(wù)知識(shí)、經(jīng)驗(yàn)、法規(guī)等信息。
- 審計(jì)文書智能編寫:利用大模型的文本生成能力,可以自動(dòng)生成審計(jì)通知書、實(shí)施方案、取證單、底稿和報(bào)告等文書,提高審計(jì)效率。
- SQL分析模型智能生成:大模型能夠根據(jù)審計(jì)需求自動(dòng)生成SQL語(yǔ)句,幫助審計(jì)人員進(jìn)行數(shù)據(jù)分析,無(wú)需深入了解SQL語(yǔ)法和數(shù)據(jù)庫(kù)技術(shù)。
- 審計(jì)方案智能設(shè)計(jì):大模型可以根據(jù)歷史審計(jì)經(jīng)驗(yàn)和知識(shí)庫(kù),自動(dòng)提供審計(jì)思路和數(shù)據(jù)分析方案,提升審計(jì)效率。
- 審計(jì)信息化智能教育培訓(xùn):大模型可以智能生成審計(jì)信息化教育培訓(xùn)所需的測(cè)試題庫(kù),提供個(gè)性化的課程知識(shí)分析與指導(dǎo)。
審計(jì)知識(shí)智能問(wèn)答搜索實(shí)踐案例
在銀行的審計(jì)工作中,存在大量非結(jié)構(gòu)化文本數(shù)據(jù),涵蓋了業(yè)務(wù)數(shù)據(jù)取證分析等方面,但缺乏一個(gè)統(tǒng)一的管理平臺(tái),依賴于人工經(jīng)驗(yàn)進(jìn)行工作。圍繞文本數(shù)據(jù)治理,達(dá)觀數(shù)據(jù)為銀行審計(jì)部開(kāi)展智能審計(jì)項(xiàng)目建設(shè)——搭建統(tǒng)一的搜索應(yīng)用平臺(tái),從非結(jié)構(gòu)化文本數(shù)據(jù)出發(fā),通過(guò)自然語(yǔ)言處理、光學(xué)字符識(shí)別等先進(jìn)AI技術(shù),可對(duì)復(fù)雜、分散存儲(chǔ)的多源異構(gòu)數(shù)據(jù)進(jìn)行文檔歸集、內(nèi)容解析、比對(duì)等,同時(shí),它還配備了強(qiáng)大的語(yǔ)義級(jí)別垂直領(lǐng)域搜索引擎,以便更好地管理智能化搜索,有效地解決審計(jì)工作中存在的信息庫(kù)建設(shè)、信息檢索、信息溯源等問(wèn)題,從而提高提高整體審計(jì)業(yè)務(wù)能力,并向全行共享,有助于推動(dòng)全行的合規(guī)建設(shè),進(jìn)而提升應(yīng)用的價(jià)值。
審計(jì)業(yè)務(wù)面臨數(shù)據(jù)信息和系統(tǒng)架構(gòu)的分散性、異構(gòu)性和復(fù)雜性,深挖各類數(shù)據(jù)的價(jià)值一直是挑戰(zhàn),銀行內(nèi)部數(shù)據(jù)的有效利用率并不高,尤其是審計(jì)部門內(nèi)部大量文本數(shù)據(jù)未形成資產(chǎn)。問(wèn)題很多:
難點(diǎn)1:非結(jié)構(gòu)化數(shù)據(jù)治理,數(shù)據(jù)多源異構(gòu),審計(jì)文檔多為過(guò)程性文檔,文檔類型十分多樣(PPT、Excel、Word、PDF、圖片),文字解析難度大
難點(diǎn)2:搭建統(tǒng)一搜索平臺(tái),關(guān)鍵詞搜索召回效果不達(dá)預(yù)期,上游數(shù)據(jù)推送不穩(wěn)定導(dǎo)致搜索數(shù)據(jù)不完整、不準(zhǔn)確
難點(diǎn)3:數(shù)據(jù)不規(guī)范,知識(shí)圖譜三元組構(gòu)建遇到阻礙,知識(shí)圖譜的數(shù)據(jù)更新需要保證準(zhǔn)確性、及時(shí)性
難點(diǎn)4:審計(jì)知識(shí)文本和筆記較為敏感,需要設(shè)計(jì)嚴(yán)密的權(quán)限體系
達(dá)觀數(shù)據(jù)建設(shè)了智能審計(jì)知識(shí)庫(kù)項(xiàng)目,一是實(shí)現(xiàn)數(shù)萬(wàn)份的多系統(tǒng)內(nèi)部文檔、數(shù)十萬(wàn)份外部監(jiān)管政策文檔等海量異構(gòu)數(shù)據(jù)存儲(chǔ)與分析。且圖片、文檔、表格解析率超95%,可實(shí)現(xiàn)圖片、文檔、表格中所有文字可搜,滿足一站式搜索服務(wù);二是搜索速度快,標(biāo)題和全文檢索速度為毫秒級(jí)別;三是搜索智能化,搜索服務(wù)中已上線了超數(shù)十種NLP模型算法用于增強(qiáng)對(duì)搜索詞的語(yǔ)義理解,實(shí)現(xiàn)了 意圖識(shí)別、模糊搜索、和搜索詞糾錯(cuò)、標(biāo)簽提取等功能。成為審計(jì)人員日常必不可少的內(nèi)外部數(shù)據(jù)快速獲取、信息關(guān)聯(lián) 的數(shù)智平臺(tái) 。一方面為常態(tài)化內(nèi)控評(píng)估與審計(jì)評(píng)價(jià)夯實(shí)技術(shù)支持,另一方面探索實(shí)現(xiàn)審計(jì)能力內(nèi)部輸出,助力一道和二道防線的內(nèi)控建設(shè)。
本案例所用達(dá)觀數(shù)據(jù)新一代大模型智能知識(shí)管理系統(tǒng),它以達(dá)觀自主開(kāi)發(fā)的“曹植”大語(yǔ)言模型為基座,堅(jiān)持訓(xùn)練數(shù)據(jù)與算法模型自主可控,為銀行提供了“算力+模型”的全套國(guó)產(chǎn)化信創(chuàng)方案。
該案例數(shù)據(jù)治理成果顯著,為銀行審計(jì)部門激活了大量歷史文檔并轉(zhuǎn)化為數(shù)據(jù)資產(chǎn)。該方案面向?qū)徲?jì)部門內(nèi)部、銀行內(nèi)部提供服務(wù),被廣泛應(yīng)用,可于工作全流程提升信息獲取速度,且提升50%以上。其中,智能審計(jì)知識(shí)庫(kù)項(xiàng)目月活部門占比率最高超80%。立足內(nèi)部審計(jì)、內(nèi)控合規(guī)等領(lǐng)域建設(shè),接入數(shù)十萬(wàn)份非結(jié)構(gòu)化文件;保障跨系統(tǒng)對(duì)接數(shù)據(jù)的實(shí)時(shí)性、穩(wěn)定性;應(yīng)用數(shù)十種NLP模型;為審計(jì)項(xiàng)目、業(yè)務(wù)合規(guī)自查提供支持,促進(jìn)業(yè)務(wù)合規(guī)穩(wěn)健發(fā)展。
[免責(zé)聲明]
原文標(biāo)題: 大語(yǔ)言模型在企業(yè)內(nèi)部審計(jì)中的實(shí)踐分析
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。




