一文讀懂:中美企業(yè)生成式AI的差距與未來
近期在研究ChatGPT大敘事之下涌現(xiàn)的新的創(chuàng)業(yè)機(jī)會時,偶然發(fā)現(xiàn)了Leonis Capital風(fēng)險投資基金Jenny Xiao (肖文泉)和Jay Zhao所撰寫的《China’s Generative AI Landscape and How It Compares to the U.S.》深度剖析了中、美在人工智能格局發(fā)展差異的根本原因,未來發(fā)展路線的差異化,以及ChatGPT浪潮之下催生的AI生成式創(chuàng)新機(jī)會。筆者在此借助GPT-4快速翻譯了這篇文章,希望能夠給大家也帶來最新的思考和啟發(fā)。
當(dāng)硅谷的投資者和創(chuàng)始人對生成式人工智能感到興奮之際,同樣的生成式人工智能狂熱也席卷了中國的同行。關(guān)于ChatGPT、DALLE-2和Stable Diffusion的新聞幾乎同時傳遍 了西方科技社區(qū)和北京。
然而,在西方鮮為人知的是,中國正在建立自己的生成式人工智能平行世界。中國的科技巨頭們正在構(gòu)建與OpenAI的ChatGPT和DeepMind的AlphaFold類似的模型,而中國的創(chuàng)業(yè)社區(qū)也逐漸察覺到了這項新技術(shù)所帶來的巨大機(jī)遇。
雖然美國的科技人員通常對于發(fā)生在硅谷以外的事情毫不知情,但政治評論員迅速聲稱中國在人工智能實施方面“領(lǐng)先于美國”,并且中美之間將出現(xiàn)一場“生成式人工智能軍備競賽”。
那么,中國的生成式人工智能領(lǐng)域到底發(fā)生了什么?它對世界其他地區(qū)有何意義?
ChatGPT發(fā)布一周內(nèi),中國科技界關(guān)于這個新聊天機(jī)器人的消息紛紛傳開。科學(xué)家開始討論人工智能何時能通過圖靈測試,科技社區(qū)開始質(zhì)疑ChatGPT是否能挑戰(zhàn)谷歌,投資者則對生成式人工智能成為下一個萬億美元產(chǎn)業(yè)感到興奮。
半年前,在2022年度百度世界大會上,百度的創(chuàng)始人兼首席執(zhí)行官李彥宏提出了一個新的市場概念:“AI生成內(nèi)容”(AIGC)。他在主題演講中強(qiáng)調(diào),在未來十年,“AIGC將顛覆所有現(xiàn)有的內(nèi)容制作模式。”他相信,AIGC有可能將原創(chuàng)內(nèi)容制作的成本降低到當(dāng)前的十分之一,并將制作過程加速數(shù)百甚至數(shù)千倍。
然而,西方實驗室發(fā)布強(qiáng)大的人工智能模型也引發(fā)了中國科技界的警鐘。針對OpenAI發(fā)布ChatGPT的反應(yīng),中國觀察家表達(dá)了對國家在技術(shù)領(lǐng)域的“落后感”的擔(dān)憂。這些API受到少數(shù)西方公司的控制,進(jìn)一步加劇了中國新興創(chuàng)業(yè)公司的焦慮情緒。
隨著ChatGPT和Stable Diffusion席卷全球,中國實驗室發(fā)布的生成式人工智能模型受到的關(guān)注要少得多。然而,中國的科技巨頭和該國最優(yōu)秀的人工智能科學(xué)家正在不懈努力地構(gòu)建相同的模型。事實上,中國似乎是除美英壟斷之外,唯一一個自行開發(fā)自己模型基礎(chǔ)設(shè)施的國家。
除了像Google、OpenAI和Meta這樣的生成式人工智能領(lǐng)域的知名參與者之外,就模型數(shù)量而言,排名前十的開發(fā)者中有四家位于中國。其中包括百度和阿里巴巴等科技巨頭、清華大學(xué)等頂尖大學(xué),以及北京人工智能研究院(BAAI)等政府贊助的實驗室。
雖然以色列的AI21實驗室和加拿大的初創(chuàng)企業(yè)Cohere也在構(gòu)建大規(guī)模模型,但除美英之外,中國是唯一一個建立和發(fā)布這些模型的多個實驗室的國家。中國還建立了自己的人工智能框架,包括華為的Mindspore和百度的PaddlePaddle。這些框架與主流的西方框架(如PyTorch和TensorFlow)不兼容,但有像Ivy這樣的轉(zhuǎn)換工具可以在這些框架之間搭建橋梁。
除了模型訓(xùn)練基礎(chǔ)設(shè)施外,中國的開發(fā)者在硬件層面上也越來越獨立。為了應(yīng)對美國制裁的威脅,中國公司越來越多地轉(zhuǎn)向國產(chǎn)GPU,如華為的Ascend 910,這些GPU幫助訓(xùn)練了PanGu-α和ERNIE 3.0 Titan等生成式人工智能模型。這些努力為發(fā)展蓬勃的生成式人工智能生態(tài)系統(tǒng)奠定了基礎(chǔ)。
在模型參數(shù)數(shù)量(模型性能的粗略代表)方面,中國模型比西方頂級模型落后大約一年。與“來自中國的更大、更強(qiáng)、更快的人工智能”的說法相反,中國在模型大小和性能上落后于西方。而且中國很難在短時間內(nèi)超越美國,主要是因為頂尖人工智能人才的差距。中國實驗室非常善于學(xué)習(xí)西方領(lǐng)先實驗室的進(jìn)步,但在提出原創(chuàng)模型和推動研究邊界方面能力不足。因此,在一段時間內(nèi),中國在生成式人工智能模型領(lǐng)域可能仍將緊隨其后。
在西方發(fā)布開源模型的情況下,中國開發(fā)者也能夠繞過昂貴的開發(fā)需求,并迅速將現(xiàn)有模型適應(yīng)到中文語境中。在Stable Diffusion發(fā)布幾個月后,中國的研究團(tuán)隊IDEA-CCNL迅速訓(xùn)練并發(fā)布了Stable Diffusion的中文版本(稱為Taiyi-Stable Diffusion)。該模型在捕捉中國文化背景方面表現(xiàn)得更好。
“鐵馬冰河入夢來”3D繪畫(宋代詩人陸游的詩句)
“水飛流三千尺”油畫(唐代詩人李白詩句)
在應(yīng)用層面上,中國的發(fā)展也落后于硅谷的初創(chuàng)企業(yè)生態(tài)系統(tǒng)。這再次挑戰(zhàn)了中國在人工智能實施方面領(lǐng)先于美國的觀點。如果你將我們的中國市場地圖與之前的硅谷市場地圖進(jìn)行比較,你會發(fā)現(xiàn)在中國還有許多垂直領(lǐng)域尚未發(fā)展起來。例如,在中國建設(shè)開發(fā)者工具和提供編碼幫助的生成式人工智能公司很少。這可能是一個完全由西方公司主導(dǎo)的領(lǐng)域,因為在開發(fā)者工具市場中存在較少的文化、語言和政策障礙。
即使在現(xiàn)有的垂直領(lǐng)域中,中國的參與者也相對較少。中國的文本生成、圖像生成和音頻生成初創(chuàng)企業(yè)的發(fā)展水平需要時間才能達(dá)到西方的水平,并且可能難以找到足夠大的市場。這是因為大部分西方的文本生成和圖像生成初創(chuàng)企業(yè)是面向企業(yè)的公司,而中國的B2B市場規(guī)模要小得多。
這意味著中國的生成式人工智能領(lǐng)域更像是一個競爭對手較少、市場動態(tài)迅速發(fā)展、甚至可能存在更多初創(chuàng)企業(yè)和投資機(jī)會的藍(lán)海。難怪中國的科技巨頭和頂級風(fēng)投基金密切關(guān)注著該國的生成式人工智能領(lǐng)域。
然而,中國的企業(yè)市場發(fā)展程度相比美國市場,企業(yè)不愿意為軟件付費,更習(xí)慣于支付服務(wù)費用。我們可能會看到中國的人工智能公司創(chuàng)造出一種本質(zhì)上是“服務(wù)為先,人工智能軟件為后”的商業(yè)模式。這些公司的行為可能與傳統(tǒng)的SaaS公司有所不同。
與美國擁有強(qiáng)大的水平SaaS市場不同,中國的人工智能公司更適合深入發(fā)展,為少數(shù)幾個大型行業(yè)提供服務(wù),而不是廣泛針對SaaS市場。在一些領(lǐng)域,中國領(lǐng)先于美國,包括電子商務(wù)、短視頻制作,也可能包括游戲。事實上,我們已經(jīng)看到中國的生成式人工智能公司進(jìn)入了這些領(lǐng)域。Fancy Technology,一家人工智能視頻生成平臺,專門針對電子商務(wù)企業(yè)。
由于文化障礙和政策限制,西方科技初創(chuàng)企業(yè)越來越放棄中國市場。在中國,可能會出現(xiàn)平行的生成式人工智能領(lǐng)域,國內(nèi)公司彼此競爭,并相對獨立于硅谷的同行公司。
然而,與其他領(lǐng)域類似,“復(fù)制到中國”的簡單模式通常不起作用。在西方,基于文本的人工智能寫作和營銷工具是最受歡迎的生成式人工智能公司類型,但在中國這類工具相對較少。中國公司較小的銷售和營銷預(yù)算對商業(yè)化構(gòu)成挑戰(zhàn)。高質(zhì)量的中文語言訓(xùn)練數(shù)據(jù)的稀缺性對高性能語言模型的發(fā)展構(gòu)成了瓶頸。更廣泛使用基于視頻的營銷意味著基于文本內(nèi)容的用例更為有限。
相反,中國正在開發(fā)自己的生成式人工智能應(yīng)用領(lǐng)域。在基于文本內(nèi)容創(chuàng)建工具方面,與銷售和營銷相關(guān)不同,許多產(chǎn)品提供普通和學(xué)術(shù)寫作支持以及翻譯。受歡迎的人工智能寫作工具 Pitaya 專注于提供學(xué)術(shù)寫作輔助和英語翻譯服務(wù)。這是因為中國龐大的學(xué)生群體常常在英語和學(xué)術(shù)寫作方面遇到困難,而中國面向全球的公司需要員工與外國同行用英語進(jìn)行溝通。
此外,一些中國基于文本的產(chǎn)品針對特定用例甚至更為狹窄的垂直領(lǐng)域。另一家領(lǐng)先的自然語言處理(NLP)初創(chuàng)企業(yè)“瀾舟”專注于金融文本分析。它使中國金融機(jī)構(gòu)能夠從成千上萬頁的會議記錄、合同和市場報告中快速提取關(guān)鍵數(shù)據(jù)點。盡管中國的通用型人工智能模型仍落后于世界領(lǐng)先模型,但構(gòu)建具有大量領(lǐng)域數(shù)據(jù)的垂直特定模型通常彌補(bǔ)了性能差距,并產(chǎn)生更好的實際應(yīng)用結(jié)果。
在中國,生成式人工智能中發(fā)展最迅速的領(lǐng)域之一是AI視頻生成,尤其是數(shù)字人和電子商務(wù)視頻營銷。與西方的AI人物形象和數(shù)字人初創(chuàng)企業(yè)傾向于追求性能不同,中國公司更加注重其形象的娛樂價值。只需比較位于倫敦的AI視頻初創(chuàng)企業(yè)Synthesia創(chuàng)建的AI人物形象與中國的小冰生成的AI員工崔筱盼即可看出。Synthesia的人物形象看起來像你日常生活中的商務(wù)人士,而小冰的人物形象崔筱盼看起來像是一位韓流偶像。
Synthesia 創(chuàng)建的 AI 頭像
小冰AI員工崔筱盼榮獲2021年萬科“年度最佳新員工”
數(shù)字人物和AI形象在中國的媒體、娛樂和電商行業(yè)中也被廣泛使用。一個原因是這些AI形象具有更高的娛樂價值,它們外觀更好,它們的創(chuàng)作者對媒體和娛樂有更好的理解。因此,消費者更愿意接受AI戀人、電視主持人和TikTok營銷人員的存在。
中國滑雪運動員谷愛玲的人工智能頭像,由數(shù)字媒體公司咪咕創(chuàng)建
另一個原因是中國的電子商務(wù)領(lǐng)域更加注重視頻而不是文本或圖像。中國有一個龐大的視頻營銷行業(yè),企業(yè)通過直播和短視頻來銷售他們的產(chǎn)品(請記住,中國是極其受歡迎的短視頻應(yīng)用TikTok的發(fā)源地)。如果中國的一些AI視頻初創(chuàng)企業(yè)取得突破并在全球范圍內(nèi)成為主導(dǎo)者,那將不足為奇。
然而,與西方的同行一樣,中國的生成式人工智能初創(chuàng)企業(yè)面臨著相同的挑戰(zhàn),包括尋找適合應(yīng)用的技術(shù)難題以及長期商業(yè)化和盈利化問題。例如,中國已經(jīng)有許多AI圖像生成應(yīng)用程序,但很少有建立可行商業(yè)模式的。大多數(shù)應(yīng)用更像玩具而不是實用工具,一旦用戶習(xí)慣了這項技術(shù),它們很可能會失去用戶的關(guān)注。商業(yè)化問題經(jīng)常出現(xiàn)在中國投資者對生成式人工智能未來前景的討論中。
談?wù)摴韫瘸鮿?chuàng)企業(yè)在全球市場的計劃是很正常的。但一提到中國企業(yè)的海外擴(kuò)張,往往會引發(fā)西方觀察者的警惕。然而,對中國初創(chuàng)企業(yè)來說,擴(kuò)張海外是一個自然的步驟,隨著中國的初創(chuàng)企業(yè)成熟,這種情況會越來越多見。隨著中國科技行業(yè)的發(fā)展,更多的企業(yè)將從一開始就面向全球市場。
這些中國初創(chuàng)企業(yè)中,許多進(jìn)入的是西方企業(yè)未充分滿足的市場。AI語音助手初創(chuàng)企業(yè)AI Rudder主要面向東南亞市場,提供近20種不同語言和當(dāng)?shù)胤窖缘漠a(chǎn)品。該公司最初在上海成立,很快在新加坡設(shè)立了辦事處,以服務(wù)東南亞市場。
AI時尚初創(chuàng)企業(yè)ZMO.ai也在中國創(chuàng)立,并獲得了來自高瓴資本和GGV Ventures等頂級中國風(fēng)險投資基金的資助。該公司已在美國和加拿大設(shè)立辦事處,并進(jìn)入北美市場。該公司為全球時尚品牌創(chuàng)建AI模型。
ZMO.ai 生成的 AI 模型圖像
一方面,中國的生成式人工智能公司希望進(jìn)軍全球市場,這是因為中國的B2B業(yè)務(wù)面臨一些挑戰(zhàn)。這在很大程度上是因為中國公司對軟件付費的意愿較低,因為在中國勞動力成本仍然較低。另一方面,具有中國背景的創(chuàng)始人很可能希望將他們的工程團(tuán)隊保留在中國,以利用中國豐富且具有成本優(yōu)勢的工程人才,就像Zoom和字節(jié)跳動所做的那樣。
中國政府在監(jiān)管生成式人工智能方面領(lǐng)先于其西方對應(yīng)機(jī)構(gòu)。2022年11月,中國國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《關(guān)于互聯(lián)網(wǎng)信息服務(wù)中深度合成內(nèi)容管理的規(guī)定》,這是一套管理合成內(nèi)容(包括AI生成的文本、圖像和視頻)的政策。這些規(guī)定于2023年1月生效,并包括風(fēng)險評估、實名用戶注冊以及標(biāo)記AI生成內(nèi)容等要求。
然而,隨著生成式人工智能產(chǎn)品變得越來越流行,其他道德和政策問題可能會出現(xiàn)。目前,AI生成內(nèi)容處于法律灰色地帶,版權(quán)和知識產(chǎn)權(quán)歸屬仍不清晰。正如OpenAI的代碼生成模型Codex面臨一名GitHub開發(fā)者的侵權(quán)訴訟,西方和中國的AI公司都對知識產(chǎn)權(quán)保持更加謹(jǐn)慎。中國的AI藝術(shù)生成初創(chuàng)公司TIAMAT確保其模型是使用沒有知識產(chǎn)權(quán)的數(shù)據(jù)進(jìn)行訓(xùn)練的。這一措施也被美國知名的藝術(shù)生成應(yīng)用Midjourney所采用。
分析中國的生成式人工智能領(lǐng)域時,不能忽視美國加強(qiáng)制裁的影響。2022年9月,美國政府禁止頂級芯片制造商Nvidia和AMD向中國銷售其最先進(jìn)的圖形處理器(GPU)。許多西方觀察家認(rèn)為,這一舉措可能會嚴(yán)重阻礙中國大規(guī)模生成式人工智能模型的發(fā)展,因為這些模型通常需要大量計算資源進(jìn)行訓(xùn)練。
然而,這些制裁對應(yīng)用層面的初創(chuàng)公司的影響相對有限,因為很少有公司使用先進(jìn)的GPU來訓(xùn)練和部署他們的人工智能模型。即使是百度等中國科技巨頭的AI云服務(wù)業(yè)務(wù),也受影響較小,他們在業(yè)務(wù)中很少使用受制裁的GPU,并且從長遠(yuǎn)來看,他們的目標(biāo)是開發(fā)自己的GPU來替代進(jìn)口產(chǎn)品。Nvidia也為中國市場專門推出了符合規(guī)定的GPU,以規(guī)避制裁。
受影響的主要是中國依賴先進(jìn)GPU來訓(xùn)練和擴(kuò)展模型的基礎(chǔ)研究機(jī)構(gòu)。事實上,中國大部分大規(guī)模生成式人工智能模型都是在Nvidia GPU上進(jìn)行訓(xùn)練的,包括大部分BAAI的Wudao 1.0和Wudao 2.0模型、清華大學(xué)的多模態(tài)CogView模型以及百度的大規(guī)模語言模型ERNIE 3.0。
最近,拜登政府正在考慮對美國對華出口投資實施新的控制措施。這些限制的影響將取決于其范圍和條件。在美國政府開始考慮對投資實施控制之前,北京已經(jīng)對美元基金的投資活動實施了限制。盡管這些基金大多數(shù)在中國注冊,但由于其資本來源于國外,它們在中國的深科技領(lǐng)域幾乎被排除在外。美國對對華出口投資的額外限制將進(jìn)一步加強(qiáng)美國和中國科技生態(tài)系統(tǒng)之間的壁壘。
中國的生成式人工智能領(lǐng)域正在快速發(fā)展,可能是除了硅谷以外最值得關(guān)注的地區(qū)。中國是美國和英國以外唯一一個開發(fā)完整“生成式人工智能技術(shù)棧”的國家,從基礎(chǔ)模型到應(yīng)用層面都有所涉及。由于中國市場在許多方面與西方市場存在很大差異,因此中國的生成式人工智能垂直領(lǐng)域與西方有著很大的不同。與此同時,中國的創(chuàng)業(yè)者和投資者面臨著與西方同行相同的生成式人工智能挑戰(zhàn),包括構(gòu)建可持續(xù)商業(yè)模式和實現(xiàn)先進(jìn)技術(shù)的商業(yè)化。中國的開發(fā)者還面臨著美國的制裁和國內(nèi)政策限制等額外挑戰(zhàn)。
我們目前仍處于中國生成式人工智能生態(tài)系統(tǒng)的初期階段。與移動時代類似,兩個生態(tài)系統(tǒng)中具有標(biāo)志性的未來以人工智能為核心的公司將呈現(xiàn)出截然不同的面貌。在美國,這些公司可能會針對傳統(tǒng)企業(yè)使用案例,得益于該國成熟的B2B軟件市場,而在中國,作為一個擁有巨大電商、供應(yīng)鏈和消費者行業(yè)的國家,我們預(yù)計將看到創(chuàng)業(yè)者構(gòu)建具有競爭力的以人工智能為核心的公司,為這些市場提供服務(wù)作為起點。
盡管基礎(chǔ)研究能力存在技術(shù)滯后,并且面臨著日益加劇的美中緊張局勢的壓力,但我們預(yù)計中國的市場和人才將繼續(xù)為本國及其他地區(qū)產(chǎn)生令人興奮的公司。
英文原版鏈接
https://www.leoniscap.com/posts/chinas-generative-ai-landscape
本文來自微信公眾號“出海后廠村”(ID:Overseas-tech),翻譯:GPT-4,校對:村長,36氪經(jīng)授權(quán)發(fā)布。
[免責(zé)聲明]
原文標(biāo)題: 一文讀懂:中美企業(yè)生成式AI的差距與未來
本文由作者原創(chuàng)發(fā)布于36氪企服點評;未經(jīng)許可,禁止轉(zhuǎn)載。
