大模型應(yīng)用的商業(yè)化進(jìn)展慢,為什么慢?
自2022年底ChatGPT發(fā)布后,截止6月份,國內(nèi)企業(yè)已經(jīng)發(fā)布了約80個(gè)基礎(chǔ)大模型,打著AI旗號(hào)的產(chǎn)品更數(shù)不勝數(shù)。但實(shí)際上大模型的商業(yè)化一直存問題,可以說,并沒有幾家企業(yè)在大模型領(lǐng)域真正產(chǎn)生大額收入,其收入可能僅占估值的1/100,絕大部分都是靠著融資以及創(chuàng)始人自有資金將企業(yè)往前推進(jìn)。文章將從幾個(gè)角度來解釋大模型應(yīng)用的商業(yè)化進(jìn)展緩慢的原因。
當(dāng)你問早期ChatGPT3.5“林黛玉為什么會(huì)倒拔垂楊柳”,他回答說“因?yàn)榱主煊癖瘋^度,倒拔垂楊柳緩解悲傷情緒”;早期的文心一言更是會(huì)回答一些匪夷所思的答案。這就是模型幻覺——一本正經(jīng)胡說八道。但當(dāng)GPT-4出來后,再問他“林黛玉為什么會(huì)倒拔垂楊柳”,他會(huì)告訴你“林黛玉是紅樓夢的人物,倒拔垂楊柳是水滸傳的情節(jié),兩個(gè)不能放在一起”。更精準(zhǔn)的回答,正是模型幻覺的減少,這也意味著大模型正在越來越好。
然而,盡管大規(guī)模模型的性能正在改善,但他們依舊存在缺陷。在商業(yè)應(yīng)用中,我們必須從小概率風(fēng)險(xiǎn)的角度去考慮。盡管GPT-4的錯(cuò)誤可能相對較小,但在某些關(guān)鍵領(lǐng)域,如航空和醫(yī)療,即使只有一次的錯(cuò)誤,也可能帶來嚴(yán)重后果。因此,我們發(fā)現(xiàn)大模型最先被應(yīng)用于容錯(cuò)率較高的行業(yè),如聊天、游戲、社交等,因?yàn)樵谶@些領(lǐng)域,偶爾的錯(cuò)誤不會(huì)帶來嚴(yán)重的影響。另一種情況,大模型作為輔助決策的存在,如辦公場景中的會(huì)議摘要等,這也就意味著,在最終的產(chǎn)品或者內(nèi)容觸達(dá)用戶之前,肯定有人的參與,來作為剔除小概率風(fēng)險(xiǎn)的保障。
GPT-4是目前最先進(jìn)的大型人工智能模型,其優(yōu)越的邏輯推理能力引領(lǐng)著業(yè)界的發(fā)展趨勢,國內(nèi)的研發(fā)也在不斷向GPT-3.5靠近。然而,對于中國的C端用戶而言,OpenAI的賬戶使用門檻較高,需要海外的郵箱、手機(jī)號(hào)和銀行賬戶,這使得只有少部分人能夠獲取到優(yōu)質(zhì)的GPT-4服務(wù)。對于國內(nèi)的B端企業(yè)希望使用GPT,一方面受限于國內(nèi)法規(guī)限制,一方面open ai不定期對亞太地區(qū)特別是中國大陸進(jìn)行封號(hào),使得B端企業(yè)很難獲得穩(wěn)定的api接口。雖然可以通過微軟云服務(wù)的方式接入,但也存在著一定的不確定性。
在商用領(lǐng)域,穩(wěn)定性是至關(guān)重要的。就像游戲體驗(yàn)中,最讓人破防的的往往是突然的宕機(jī),而這在ChatGPT這樣的世界級(jí)產(chǎn)品中也出現(xiàn)過多次。對于依賴GPT-3.5或4作為底層模型的企業(yè),用戶會(huì)對任何宕機(jī)行為產(chǎn)生抱怨,但他們不會(huì)關(guān)心問題的來源,只會(huì)感到服務(wù)的中斷并把憤怒發(fā)泄到企業(yè)。通常,企業(yè)會(huì)選擇備用模型以應(yīng)對核心模型的突然問題,然而目前在商用層面特別是國內(nèi),還沒有能真正匹敵GPT-4的模型。這意味著,即使備用模型能保證穩(wěn)定性,其效果和用戶體驗(yàn)卻可能大大低于以前,這是所有企業(yè)都不愿意看到的。
對于基礎(chǔ)大模型的開發(fā),這顯然不是所有企業(yè)都能參與其中的,其訓(xùn)練成本極其高昂。對于大多數(shù)人來說,更多地是從使用者的角度與大模型打交道。盡管對于采用大模型的企業(yè)來說,API的價(jià)格已經(jīng)大幅降低,比如2023年3月份ChatGPT API的價(jià)格比2022年底下滑了90%,而在2023年6月份,輸入端的價(jià)格再次降低了25%。即使如此,這種新型的計(jì)算方式相較于傳統(tǒng)的運(yùn)算方式依然更加昂貴。據(jù)路透社報(bào)道,谷歌的母公司Alphabet的董事長John Hennessy表示,與大型語言模型進(jìn)行交互的成本可能是進(jìn)行標(biāo)準(zhǔn)關(guān)鍵詞搜索的10倍。所以,雖然大模型的使用成本已經(jīng)在不斷下降,但其價(jià)格依然不菲。
另外,僅僅將大模型接入到特定的領(lǐng)域,可能并不能達(dá)到最佳的效果。因此,在接入API并將其投入商用之前,企業(yè)還需要在諸多方面付出額外的成本。這包括數(shù)據(jù)準(zhǔn)備和預(yù)處理的成本、模型訓(xùn)練和調(diào)優(yōu)的成本、部署和運(yùn)維的成本、模型更新和迭代的成本,以及法規(guī)合規(guī)的成本。所有這些因素都使得應(yīng)用大模型的總體成本依然很高。
以科大訊飛的學(xué)習(xí)機(jī)T20為例,由于其搭載了星火大模型,其價(jià)格比前一代的T10高出2000元。據(jù)業(yè)內(nèi)人士透露,這額外的2000元其實(shí)并沒有覆蓋大模型的成本。考慮到市面上一臺(tái)普通的學(xué)習(xí)機(jī),其硬件制造和版權(quán)購買的總成本也僅在1000-1500元左右,這就更加凸顯了大模型在商業(yè)應(yīng)用中的高昂成本。
商業(yè)得以運(yùn)轉(zhuǎn),核心是收益能否超越成本。目前的商業(yè)環(huán)境已經(jīng)不再青睞通過燒錢搶占市場或者策略性虧損的策略,而是更傾向于自我造血的企業(yè)。然而大模型領(lǐng)域的企業(yè)自我造血能力均欠佳。
以目前的頭部大模型企業(yè)為例。OpenAI是目前最知名的AI大模型公司,雖然他們已經(jīng)籌集了超過100億美元的資金,并且公司估值達(dá)到了290億美元,但是他們預(yù)計(jì)在2023年的收入只有2億美元。另一個(gè)例子是Hugging Face,作為全球最大的AI/ML社區(qū)和平臺(tái),同時(shí)也是最重要的大模型基礎(chǔ)設(shè)施之一,他們的估值是20億美元,但growjo對其年收入預(yù)估僅0.3億美元。另一家獨(dú)角獸公司Adept AI,他們是AI助手(大模型應(yīng)用)的開發(fā)者,雖然他們籌集了4.1億美元的資金,公司估值達(dá)到了10億美元,但growjo對其年收入預(yù)估只有0.04億美元,可以說幾乎還沒有商業(yè)化。
國內(nèi)的各大模型公司,例如百度、阿里、騰訊、華為等,雖在大模型領(lǐng)域有所布局,但并未從中獲取實(shí)質(zhì)性的豐厚收益。此外,大模型領(lǐng)域的中小型獨(dú)立企業(yè),其收入可能僅為公司估值的百分之一。尤其對于直面C端用戶的產(chǎn)品,大公司在沒有全面考慮的策略前,往往謹(jǐn)慎行事,不輕易推向市場。因此,像文心一言、通義千問、星火大模型等產(chǎn)品,都需要用戶申請才能使用,而非直接面向公眾。對于中小型公司,雖然它們能迅速推出產(chǎn)品,但由于資金等限制,產(chǎn)品往往處于冷啟動(dòng),推廣困難,因此大模型領(lǐng)域的小公司用戶數(shù)通常較少。
大模型的確是一項(xiàng)優(yōu)秀的技術(shù),但它當(dāng)前的價(jià)值更多地體現(xiàn)在"錦上添花",而不是"雪中送炭"。也就是說,大模型帶來的邊際價(jià)值,并未能滿足市場的剛需。從商業(yè)模式上看,大部分的產(chǎn)品都是以原產(chǎn)品的增值服務(wù)的方式提供,而非推出獨(dú)立產(chǎn)品。如多鄰國的涵蓋大模型AI能力的增值訂閱服務(wù),售價(jià)30美元/月;Quizlet的增值服務(wù)AI導(dǎo)師Q-chat,訂閱費(fèi)用為3.99美元/月。
大模型的上游企業(yè)收取中游企業(yè)的接入費(fèi),而中游企業(yè)則通過向下游用戶收費(fèi)來提供基于大模型的產(chǎn)品。最終,是用戶的需求驅(qū)動(dòng)了整個(gè)市場。但是,為什么用戶不愿意為大模型付費(fèi)呢?
首先,AI領(lǐng)域的發(fā)展和普及需要時(shí)間。許多領(lǐng)域,包括專業(yè)領(lǐng)域如midjourney和GEN2,甚至包括熱門產(chǎn)品如ChatGPT,都還沒有得到廣泛的了解。其次,模型的成熟度對用戶的接受程度有重要影響。如果用戶接觸到的產(chǎn)品不夠成熟,他們可能無法充分體驗(yàn)到大模型的能力,這可能直接降低他們對大模型的評(píng)價(jià)和付費(fèi)意愿。最后,付費(fèi)方式和費(fèi)用也是影響用戶付費(fèi)意愿的重要因素。如果付費(fèi)方式復(fù)雜或費(fèi)用過高,原有路徑依賴直接阻礙了用戶付費(fèi)。
教育信息化來說,一般情況下,購買方往往是學(xué)校或教育局,而真正使用這些產(chǎn)品的卻是老師。只有深入了解教師在教學(xué)過程中面臨的實(shí)際問題,推出的信息化產(chǎn)品才能真正提升教學(xué)效率。過于追求大屏幕或快速反應(yīng)等技術(shù)特性,往往只是企業(yè)自我陶醉。同理,此前線下培訓(xùn)為何受歡迎?原因在于,面對面的教學(xué)效果通常更好,而且家長能把孩子交給老師,從而得到休息的時(shí)間。相較而言,盡管在線教育在某種程度上解決了學(xué)習(xí)問題,但家長仍需監(jiān)督孩子在家的學(xué)習(xí),家長并沒有獲得整塊的休息時(shí)間。
識(shí)別用戶需求并不簡單,特別是在應(yīng)用大模型技術(shù)的過程中。可能與大模型簽約的并非實(shí)際的用戶,或者用戶根本無法表達(dá)出自己的實(shí)際需求。例如,在使用大模型實(shí)現(xiàn)學(xué)生答疑的時(shí)候,可能會(huì)以為學(xué)生只關(guān)注學(xué)習(xí)相關(guān)的問題,但實(shí)際上,除了提問,許多學(xué)生更渴望的是交談的機(jī)會(huì)。有時(shí)候,學(xué)生說出的十句話中,可能有九句是想與老師閑聊,但如果問學(xué)生,學(xué)生說,“我就是想問問題”。
因此企業(yè)必須深入理解用戶,尋找用戶真正的痛點(diǎn),而不是讓技術(shù)變成一種噱頭。技術(shù)本質(zhì)上是一種手段,而滿足用戶需求才是真正追求的目標(biāo)。
當(dāng)然,大模型商用落實(shí)到實(shí)踐的時(shí)候,還有更多的問題。我們也將在之后的文章中,逐一展開。
本文來自微信公眾號(hào)“多知網(wǎng)”(ID:duozhiwang),作者:大力正手,36氪經(jīng)授權(quán)發(fā)布。
[免責(zé)聲明]
原文標(biāo)題: 大模型應(yīng)用的商業(yè)化進(jìn)展慢,為什么慢?
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。
