教訓慘痛!谷歌如何從AI老大哥一步步跌落神壇?
新智元報道
【新智元導讀】谷歌早已成為部署高度專業(yè)化AI任務模型的專家,但當涉及到大動作時,停留在舒適圈讓他們得到了慘痛的代價。
谷歌腸子都悔青了。
多年來一心一意崇拜的VR,目前看來是個假神。
現(xiàn)在眼看著對手微軟和OpenAI憑ChatGPT賺足了眼球,谷歌趕忙轉(zhuǎn)換戰(zhàn)略,加速AI的研發(fā)。
諷刺的是,這一切之所以發(fā)生,是因為谷歌此前篤定地認為,自己已經(jīng)壟斷了AI的市場。
谷歌確實有理由這樣認為。
在2017年,谷歌的研究人員發(fā)布了著名的論文「Attention is all you need」,引入了Transformer的概念,并極大地提升了機器學習模型的潛在能力。
要概括Transformer巨大的影響力,只要說這一句話就夠了:它就是GPT中的「T」。
你可能會問:這么好的東西,谷歌會為什么免費開源呢?
大型私人研究機構(gòu)過去常常被批隱瞞自己的工作,不過這幾年,開源已成一種趨勢。
因為,這是一場事關(guān)聲望的游戲,也是對研究人員的讓步——他們更希望雇主別把自己的光芒掩蓋起來。
當然,這其中也有傲慢的成分:作為這項技術(shù)的發(fā)明者,谷歌怎么可能不是它最好的利用者呢?
后來的故事,我們都知道了。
這股ChatGPT熱,來得猝不及防。
學會理解和利用一種新工具,都需要時間。現(xiàn)在,每家大型科技公司都在探索,AI的新時代會帶來什么,而它們?yōu)榇诵枰鍪裁础?/span>
而做出ChatGPT基礎(chǔ)架構(gòu)Transformer的谷歌,腸子都悔青了。
可以理解,谷歌不想過早地將搜索與他們現(xiàn)有的半生不熟的通用LLM模型合并,來宰殺金鵝。他們已經(jīng)成為部署高度專業(yè)化的AI任務模型的專家,這些模型可以完成一兩件事。
但當涉及到大動作時,他們舒適的位置讓他們背上了惰性。
所以谷歌垮臺了嗎?當然沒有,在不久的將來,它仍將大家默認的一家利潤豐厚的大科技公司。只是看起來有點好笑。
不斷改進Assistant,有點徒勞
這幾年里,它在設(shè)計AI計算硬件方面取得了重大進展,為開發(fā)人員構(gòu)建了有用的平臺,來測試和開發(fā)機器學習模型,并發(fā)表了大量論文,從模型的微調(diào)到語音合成。
谷歌首席執(zhí)行官 Sundar Pichai于2018年5月8日在Google I/O 2018大會上發(fā)表主題演講
但是,這家公司也存在一個嚴重的問題。
不少人都從谷歌員工和其他業(yè)內(nèi)人士那里聽到過這樣的軼事——谷歌的運作方式太封建了。這里似乎有一種約定俗成的觀點,即讓項目在現(xiàn)有產(chǎn)品(如地圖或助手)的支持下運轉(zhuǎn),才是一種可靠的掙錢方式。
因此,盡管公司里已經(jīng)囤積了許多世界上最優(yōu)秀的AI研究人員,但他們的才能似乎只能受困于企業(yè)戰(zhàn)略的軌道。
這樣做的結(jié)果是什么?讓咱們來看看下面這個時間表。
2018年,谷歌的成果是改進了的Google Assistant flow、Photos(比如為單色圖像著色)、帶有「視覺優(yōu)先版助手」的智能顯示器(有人見過嗎?)、地圖助手、AI輔助的Google新聞和MLKit。
Google Assistant即將登陸Google地圖
2019年,谷歌展示了更出名、尺寸更大的智能顯示器、AR搜索結(jié)果、AR地圖、Google Lens更新、網(wǎng)絡(luò)Duplex(還有人記得Duplex嗎?)、可以在本地完成更多工作的壓縮版Google Assistant、Waze中的助手、駕駛模式中的助手、實時字幕、現(xiàn)場轉(zhuǎn)播(語音識別)以及一個更好地了解語言障礙人士的項目。
當然,可以肯定地說,其中某些產(chǎn)品很棒!
然而,它們中的大多數(shù)只是一個現(xiàn)成的東西,區(qū)別是得到了AI的推動。
谷歌推出ML Kit,這是一個SDK,可以輕松地將AI添加到iOS和Android應用程序
現(xiàn)在再回想起來,很多人都會感覺到,谷歌的確有點畏縮。
像谷歌這樣的大公司,本應該是能順應趨勢、推動潮流的。
谷歌推出了Duplex,這是一種基于人工智能的客戶服務工具,旨在幫助小型企業(yè)(如餐館和美發(fā)沙龍)接聽更多電話、回答常見問題并安排預訂
而在2019年2月,OpenAI有這樣一條新聞:《OpenAI構(gòu)建了一個非常好的文本生成器,但因為太危險,所以不能發(fā)布》。
這條新聞里講的不是GPT-3,不是GPT-3.5……而是GPT-2。
2020年,谷歌制作了一個由AI驅(qū)動的Pinterest克隆,然后在12月解雇了Timnit Gebru——AI倫理領(lǐng)域的主要發(fā)聲人之一,因為他寫了一篇論文,指出了這個技術(shù)的局限性和危險。
雖然如今我們看到了ChatGPT的大紅大紫,但其實當初OpenAI的聯(lián)合創(chuàng)始人Sam Altman也曾不得不親自壓制對GPT-3的炒作,因為它超過了可承受的水平。
而在2021年,谷歌的大語言模型LaMDA首次亮相,但谷歌并沒有真正把它推向市場。據(jù)悉,除了減少Assistant拋出的錯誤之外,谷歌仍然在尋找讓它存在的理由。
而OpenAI的2021年是以DALL-E開始的,這個文本到圖像模型很快變得家喻戶曉。
OpenAI證明了,通過CLIP等系統(tǒng),LLM不僅可以執(zhí)行語言任務,還可以充當通用的解釋和生成引擎。
2022年,谷歌干的事情就是對Assistant的更多調(diào)整、更多的智能顯示器、更多的AR 地圖,以及花1億美元收購AI 生成的個人資料圖片(收購Alter)。
同一年,OpenAI在4月發(fā)布了DALL-E 2 ,在12月發(fā)布了ChatGPT。
或許在2022年初的某一刻,當谷歌高管睜開眼睛的時候,被眼前的東西嚇壞了。
可以想象,疑惑的谷歌高管們急忙發(fā)送電子郵件,詢問為什么一些有活力的初創(chuàng)公司正在圍繞著OpenAI運行。
證據(jù)是,Imagen在DALL-E 2發(fā)布一個月后就退出了,實際上,退不退出也沒什么區(qū)別,就像谷歌公布的其他AI研究一樣,任何人都無法測試它,更不用說連接到API了。
然后,Meta在9月發(fā)布了Make-A-Video后,谷歌在一周之后就以Imagen Video做出回應。然后Riffusion在生成音樂方面掀起了波瀾,一個月后,MusicLM就出現(xiàn)了(同樣的,我們?nèi)匀徊荒苡盟?/span>
但可以肯定,谷歌這樣對別家亦步亦趨,正是因為ChatGPT帶給谷歌領(lǐng)導層的焦慮,讓他們只能全力以赴。
但其實內(nèi)部人士都知道,ChatGPT與谷歌投資了十年的助理產(chǎn)品截然不同,后者其實是假裝出來的偽AI(實際上只是一組API的自然語言前端罷了)。
但谷歌被生存競爭嚇到了。
時勢造英雄
但搜索引擎,成功地將微軟對創(chuàng)新的需求與大規(guī)模語言模型的核心競爭力結(jié)合了起來,進而造就了最新的GPT模型與必應和Edge的整合。
看到這一點的谷歌顯然是急了,于是搶在微軟發(fā)布ChatGPT版必應的前一天,試圖用一篇空洞的博文來吸引眼球。
但由于發(fā)布得過于匆忙,以至于在兩天后的「搜索和人工智能」活動中,谷歌甚至都沒怎么提到有關(guān)Bard的內(nèi)容。
此外,用來宣傳Bard的圖片里,還包含一個非同小可的錯誤:詹姆斯-韋伯太空望遠鏡「首次拍攝了太陽系外行星的照片」。顯然,這是錯的。
更令人震驚的是,谷歌內(nèi)部竟然沒人發(fā)現(xiàn),甚至沒人關(guān)心這個問題。
當然,ChatGPT也有自己的問題。
但谷歌倉促出手,并在如此明顯地被絆倒。恰恰說明,即使是在有限的、實驗性的水平上,谷歌也缺乏準備,更不用說像微軟這樣已經(jīng)開始在全球推廣了。
谷歌還是那個谷歌
當然不是,在不久的將來,它仍將是我們默認的搜索引擎,以及一家利潤豐厚的公司。
但從隨后的股價大跌上也能看出,投資者的信心已經(jīng)被動搖了。
事實證明,谷歌在過去幾年里,都沒有進行任何有意義的創(chuàng)新。而這可能并不是出于智慧,而是出于自傲。
不過,當新的技術(shù)尚未證明自己能夠像所有人想的那樣有價值時,我們也無法做出過多的預測。
本文來自微信公眾號“新智元”(ID:AI_era),作者:新智元,36氪經(jīng)授權(quán)發(fā)布。
