36個(gè)月大逆轉(zhuǎn):谷歌AI攜Gemini 3回歸,邁向世界模型新征程
自ChatGPT發(fā)布已過(guò)去近36個(gè)月,面對(duì)OpenAI的領(lǐng)先優(yōu)勢(shì),哈薩比斯引領(lǐng)谷歌AI展開(kāi)全面反攻,憑借新發(fā)布的Gemini 3強(qiáng)勢(shì)回歸。Gemini 3在LM Arena等多個(gè)模型榜單上登頂,表現(xiàn)超越GPT - 5及其他模型,實(shí)現(xiàn)了一場(chǎng)完美逆襲。
大模型排行榜競(jìng)爭(zhēng)激烈,你方唱罷我登場(chǎng)。
馬斯克的Grok 4.1剛登頂不久,就被Gemini 3 Pro反超,上演了AI版的「速度與激情」!

谷歌DeepMind CEO哈薩比斯(Demis Hassabis)在X平臺(tái)上興奮地曬出Gemini 3的優(yōu)異成績(jī),稱其「理所當(dāng)然地」登頂各大排行榜,并表示這是他迄今為止最喜愛(ài)的模型。

就連奧特曼和馬斯克,也紛紛為Gemini 3點(diǎn)贊。


馬斯克連發(fā)兩個(gè)哭泣的表情包,稱:看來(lái)我們要盡快推Grok 4.2了。

新發(fā)布的Gemini 3具備領(lǐng)先的推理、多媒體處理和編碼能力,擅長(zhǎng)推理、生成視頻和編寫代碼。谷歌強(qiáng)調(diào),Gemini 3不只是一個(gè)更聰明的模型或聊天機(jī)器人,更重要的是,從發(fā)布之日起,它就開(kāi)始全面增強(qiáng)谷歌現(xiàn)有產(chǎn)品,包括利潤(rùn)可觀的搜索業(yè)務(wù)。它是谷歌這臺(tái)龐大賺錢機(jī)器的AI引擎,用哈薩比斯的話說(shuō):「我們是谷歌的動(dòng)力引擎,現(xiàn)在我們正在讓AI全面接入」。
哈薩比斯認(rèn)為目前可能存在AI泡沫問(wèn)題,比如許多未經(jīng)檢驗(yàn)的初創(chuàng)公司卻獲得了數(shù)十億美元的估值。但在他看來(lái),即便AI泡沫破裂,Gemini 3也讓谷歌有了穿越這場(chǎng)泡沫的底氣。
把Google搜索塞進(jìn)Gemini
谷歌內(nèi)部一直有把Google搜索「塞」進(jìn)Gemini的想法,這一想法甚至可追溯到谷歌早期。當(dāng)時(shí)的Larry Page和Sergey Brin就設(shè)想過(guò)把整個(gè)互聯(lián)網(wǎng)放進(jìn)AI的「記憶」中,然后對(duì)外提供服務(wù)。為此,谷歌在上下文方面做了大量實(shí)驗(yàn),將上下文窗口提升到100萬(wàn)個(gè)token,目前該記錄仍未被打破。
哈薩比斯認(rèn)為,機(jī)器理論上可擁有比人類多幾百萬(wàn)倍的存儲(chǔ)/記憶空間,但簡(jiǎn)單地暴力存儲(chǔ)所有東西并不高效。因此,與將Google搜索「塞」進(jìn)Gemini相比,谷歌更多是把Gemini作為現(xiàn)有產(chǎn)品的底層模型向用戶開(kāi)放。
此次Gemini 3發(fā)布后,谷歌已通過(guò)Gemini應(yīng)用以及Google搜索中的AI Overviews功能向用戶開(kāi)放。據(jù)谷歌母公司Alphabet在7月的季度財(cái)報(bào)顯示,AI Overviews推動(dòng)搜索查詢量提升了10%,同時(shí),谷歌視覺(jué)搜索出現(xiàn)了70%的激增,該功能依賴于Gemini對(duì)照片的分析能力。
與OpenAI相比,谷歌的優(yōu)勢(shì)在于其產(chǎn)品「家底」深厚,擁有搜索、Google地圖、Gmail、云服務(wù)等廣泛的基礎(chǔ)產(chǎn)品線,且很早就開(kāi)始利用AI增強(qiáng)已有產(chǎn)品的能力,這使其在與OpenAI、xAI、Anthropic等AI廠商的競(jìng)爭(zhēng)中進(jìn)退自如。哈薩比斯表示,「在不利情況下,我們會(huì)更依靠這些基礎(chǔ)產(chǎn)品;在有利情況下,我們擁有最全面的布局和最具前瞻性的研究?!?/p>
谷歌還考慮通過(guò)Gemini重啟谷歌眼鏡(Google Glass)項(xiàng)目。哈薩比斯稱,當(dāng)時(shí)谷歌眼鏡步子邁得超前,缺少真正的「殺手級(jí)用例」,而通用助手正是這樣一個(gè)用例。未來(lái),Gemini將激活谷歌以往積累的「經(jīng)驗(yàn)和遺產(chǎn)」,重點(diǎn)放在「世界理解」上。
以Gemini為例,谷歌一開(kāi)始就將機(jī)器人和眼鏡視為重要應(yīng)用場(chǎng)景,因此選擇走多模態(tài)路線。如今,這些押注逐漸顯現(xiàn)成果,Gemini在多模態(tài)理解上優(yōu)勢(shì)明顯。
除增強(qiáng)現(xiàn)有和以往產(chǎn)品外,谷歌還積極利用AI打造受歡迎的新工具,如NotebookLM可根據(jù)文字材料自動(dòng)生成播客,AI Studio能借助AI快速生成應(yīng)用原型等。此外,谷歌還探索將技術(shù)應(yīng)用到游戲、機(jī)器人等領(lǐng)域。
哈薩比斯提到谷歌AI的一個(gè)優(yōu)勢(shì),目前所有產(chǎn)品已完全基于Gemini技術(shù)棧運(yùn)行,實(shí)現(xiàn)了從產(chǎn)品到模型的「一體化」。這意味著產(chǎn)品改動(dòng)和模型微調(diào)更易進(jìn)行,產(chǎn)品也能更好地理解和使用底層模型。
目前,哈薩比斯一半精力用于加速做強(qiáng)Gemini應(yīng)用,另一半用于將AI融入谷歌各業(yè)務(wù)線,使其成為谷歌的「AI動(dòng)力艙」。他表示:「我對(duì)這一切非常興奮,目前我們只是剛剛觸及未來(lái)可能性的表面,明年會(huì)更直觀地看到這些變化」。
被OpenAI「搶跑」后,谷歌正快速趕上
谷歌在AI領(lǐng)域長(zhǎng)期投入大量資源,取得了一系列關(guān)鍵突破。2017年,谷歌發(fā)現(xiàn)了Transformer模型架構(gòu),但未將其商業(yè)化,而是選擇公開(kāi)。直到2022年,OpenAI基于Transformer的ChatGPT爆火,動(dòng)搖了谷歌的核心搜索業(yè)務(wù),谷歌才開(kāi)始奮起直追。
有意思的是,OpenAI的崛起不僅喚醒了谷歌在AI領(lǐng)域的加速發(fā)展,還間接幫助谷歌避免了被分拆、出售搜索業(yè)務(wù)的命運(yùn)。如今,谷歌的搜索業(yè)務(wù)不僅未被OpenAI等AI新勢(shì)力顛覆,其AI模型還實(shí)現(xiàn)了反超。
與Gemini 3相比,OpenAI在8月發(fā)布的GPT - 5令人失望,一些評(píng)論者認(rèn)為它「表現(xiàn)平平」,用戶也抱怨其風(fēng)格變得更正式。據(jù)谷歌稱,Gemini 3在LM Arena等多個(gè)模型榜單上表現(xiàn)優(yōu)于GPT - 5及其他模型,尤其在模擬推理和長(zhǎng)時(shí)間規(guī)劃方面表現(xiàn)更佳,有助于提升依賴工具或互聯(lián)網(wǎng)的AI智能體的實(shí)際能力。
在早期的AI競(jìng)賽中經(jīng)歷波折后,谷歌漸入佳境。從用戶活躍度看,Gemini應(yīng)用的月活用戶已超6.5億,僅次于ChatGPT的7 - 8億周活用戶(換算成月活可能超10億)。每月超20億人通過(guò)搜索里的AI Overviews使用Gemini,約1300萬(wàn)開(kāi)發(fā)者在自己的產(chǎn)品中集成了Gemini。這些數(shù)字表明谷歌正逐漸縮小與OpenAI在AI領(lǐng)域的差距,作為谷歌AI總負(fù)責(zé)人的哈薩比斯也能松口氣了。
各方面都最強(qiáng)才叫AGI,實(shí)現(xiàn)還要5 - 10年
哈薩比斯表示,谷歌仍在追求做「各方面都最強(qiáng)」的模型,在他看來(lái),這才是真正的通用模型,也是通向通用人工智能(AGI)系統(tǒng)的關(guān)鍵組成部分。從之前的版本到Gemini 3,谷歌一直在彌補(bǔ)Gemini模型的短板,提升其編程、推理、數(shù)學(xué)等能力。
此次Gemini 3在2.5版本基礎(chǔ)上迭代,一方面升級(jí)基礎(chǔ)能力,另一方面鞏固多模態(tài)領(lǐng)域的優(yōu)勢(shì)。哈薩比斯認(rèn)為未來(lái)AI的技術(shù)路線會(huì)趨于收斂,擁有通用、全能的基礎(chǔ)模型是關(guān)鍵。
除Gemini 3 Pro外,Gemini模型家族的其他成員也在打磨中,待這些模型就位后,谷歌將在產(chǎn)品分層服務(wù)上提供更大靈活性,即更強(qiáng)性能、更低價(jià)格。正如哈薩比斯所說(shuō):「大方向是每一代新模型,都要在整體能力上更強(qiáng),同時(shí)所需算力更便宜、更高效,帶來(lái)更有競(jìng)爭(zhēng)力的價(jià)格和更低的時(shí)延」。
目前,哈薩比斯在世界模型研究上投入大量時(shí)間,他認(rèn)為這是通往AGI的關(guān)鍵組件,未來(lái)世界模型也將迎來(lái)類似ChatGPT的「爆發(fā)時(shí)刻」。但最大挑戰(zhàn)是推理/服務(wù)成本,以及解決在更長(zhǎng)時(shí)間尺度上保持世界一致性等關(guān)鍵難題,才能實(shí)現(xiàn)真正的「破圈」。
哈薩比斯稱,目前世界模型已有一些內(nèi)部用例,如訓(xùn)練其他智能體、機(jī)器人系統(tǒng)等,未來(lái)可能會(huì)出現(xiàn)很酷的外部應(yīng)用場(chǎng)景。他仍堅(jiān)持對(duì)通用人工智能(AGI)時(shí)間表的預(yù)測(cè),認(rèn)為距離完全實(shí)現(xiàn)AGI還有五到十年,Gemini 3將成為打造更強(qiáng)大AI的重要平臺(tái),還需在現(xiàn)有模型不斷變強(qiáng)的基礎(chǔ)上取得一兩次關(guān)鍵性突破。
在通往AGI的路上,哈薩比斯也有算力焦慮。他坦言「即便將現(xiàn)在全世界的算力加在一起,也不夠滿足我們想做的所有事情」。因此,需要在不同項(xiàng)目間衡量算力投入的回報(bào),如研究收益、新產(chǎn)品探索價(jià)值或直接收入等。
除追求AGI外,哈薩比斯還帶領(lǐng)DeepMind在AlphaEvolve等科學(xué)領(lǐng)域進(jìn)一步拓展。
穿越AI泡沫的底氣
談到AI泡沫,哈薩比斯總體比較樂(lè)觀,但認(rèn)為仍存在一定泡沫。他說(shuō):「那些幾乎沒(méi)什么的項(xiàng)目,種子輪估值就能到幾十億美元,這在邏輯上有點(diǎn)行不通?!箤?duì)比這些泡沫,他認(rèn)為谷歌的處境很好。
就DeepMind而言,既有扎實(shí)營(yíng)收,又承擔(dān)著谷歌「AI動(dòng)力艙」的重任;既有Gemini模型及App,還有基于Gemini的NotebookLM等AI優(yōu)先產(chǎn)品。哈薩比斯表示,目前AI已在谷歌現(xiàn)有業(yè)務(wù)中帶來(lái)顯著回報(bào),正在為搜索、YouTube、云等業(yè)務(wù)「加功率」。
作為DeepMind的聯(lián)合創(chuàng)始人,哈薩比斯12年前選擇與谷歌「聯(lián)手」時(shí),就考量過(guò)雙方合作的價(jià)值:谷歌可提供海量算力資源,其產(chǎn)品也天然適合用AI增強(qiáng)。目前,這條路正逐步成為現(xiàn)實(shí)。在哈薩比斯看來(lái),谷歌與DeepMind的結(jié)合,讓谷歌在AI競(jìng)爭(zhēng)中處于有利位置,使其有機(jī)會(huì)穿越泡沫,笑到最后。
參考資料:
https://sources.news/p/demis - hassibas - on - gemini - 3 - world?r = 1r85f%20
https://www.wired.com/story/google - launches - gemini - 3 - ai - bubble - search/
本文來(lái)自微信公眾號(hào)“新智元”,作者:新智元,編輯:元宇,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

