文心一言來了,ChatGPT的壓力李彥宏接住了嗎
李彥宏表示,不能說完全ready了,對標(biāo)ChatGPT的門檻很高,但百度在全球大廠中第一個做出來了。
“十月懷胎,一朝分娩?!?/p>
研發(fā)近5年,提前一個月宣傳造勢,備受關(guān)注的百度文心一言終于揭開神秘面紗。
3月16日,百度基于文心大模型技術(shù)打造的生成式對話產(chǎn)品——文心一言正式亮相。據(jù)百度創(chuàng)始人、董事長兼CEO李彥宏介紹,文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成等方面有突出能力。

作為國內(nèi)少有擁有大模型技術(shù)的企業(yè),百度從2019年開始進(jìn)行大模型探索,打造文心大模型家族,包含PLATO、ERNIE 3.0等多個NLP大模型,其中PLATO主打?qū)υ捊换ァ募夹g(shù)出發(fā),文心過往在NLP模型上的實(shí)踐,成為百度打造“文心一言”的基礎(chǔ)。
“從這個意義上說,文心一言的發(fā)布只是我們過去多年努力的自然延續(xù)?!崩顝┖瓯硎?。
為什么要在此時發(fā)布文心一言?百度真的ready了嗎?針對這個高頻問題,李彥宏回答:“因?yàn)槭袌鲂枨蟆!?/p>
“我自己在內(nèi)測過程中體驗(yàn)到,(文心一言的)能力確實(shí)談不上完美?!崩顝┖晏拐\,但是包括搜索、智能云、自動駕駛和小度在內(nèi)的百度各個產(chǎn)品線都在等著使用這項(xiàng)技術(shù)。尤為重要的是,百度的客戶也在等著這項(xiàng)技術(shù)的發(fā)布。
在半個小時的介紹里,李彥宏介紹了文心一言的實(shí)用功能。不過因?yàn)楝F(xiàn)場打字不方便,發(fā)布會現(xiàn)場并沒有實(shí)時演示文心一言的各項(xiàng)功能,而是使用了提前錄好的demo視頻。

在百度發(fā)布文心一言的前一天,OpenAI發(fā)布了GPT-4,被冠以“作為迄今為止規(guī)模最大、功能最強(qiáng)大的多模態(tài)預(yù)訓(xùn)練模型”。
作為同類型產(chǎn)品,文心一言自然免不了被拿來做對比。李彥宏認(rèn)為,“ChatGPT的門檻還是很高的”,而文心一言“還是有很多不完美的地方”。
“全球大廠中,百度是第一個發(fā)布的,大家都知道微軟是直接調(diào)用OpenAI,其它的大廠現(xiàn)在都沒有真正發(fā)布同類型、同級別的產(chǎn)品。百度是第一個。”李彥宏說,文心一言這樣的大語言模型,會成為每個人必不可少的生產(chǎn)力工具。
自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入文心一言生態(tài)。

發(fā)布會尾聲,百度公布了文心一言的邀請測試方案——3月16日起,首批用戶即可通過邀請測試碼,在文心一言官網(wǎng)體驗(yàn)產(chǎn)品,后續(xù)將陸續(xù)開放給更多用戶。此外,百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務(wù)。
根據(jù)百度提供的數(shù)據(jù),發(fā)布會后一小時內(nèi),排隊(duì)申請文心一言企業(yè)版API調(diào)用服務(wù)測試的企業(yè)用戶已達(dá)3萬多家,申請產(chǎn)品測試網(wǎng)頁多次被擠爆,百度智能云官網(wǎng)流量飆升百倍。
但資本市場對此卻有不同的表現(xiàn)。在文心一言發(fā)布的同時,百度股價盤中一度大跌10%。
01 不完美"小孩"
發(fā)布會現(xiàn)場,李彥宏展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成等五個使用場景方面的表現(xiàn)。
文學(xué)創(chuàng)作場景中,文心一言根據(jù)對話問題將科幻小說《三體》的核心內(nèi)容進(jìn)行了總結(jié),并提出了五個續(xù)寫《三體》的建議角度;在商業(yè)文案創(chuàng)作場景中,文心一言完成了給公司起名、寫Slogan、寫新聞稿的創(chuàng)作任務(wù);面對“雞兔同籠”這類涉及推理等相對復(fù)雜的任務(wù),文心一言也給出了正確解題思路及答案。
作為扎根于中國市場的大語言模型,文心一言在中文語言和中國文化上有更好的表現(xiàn)?,F(xiàn)場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應(yīng)的經(jīng)濟(jì)學(xué)理論,還用“洛陽紙貴”四個字創(chuàng)作了一首藏頭詩。
不過,李彥宏也承認(rèn),文心一言對英文語種、代碼場景的訓(xùn)練還不夠多,表現(xiàn)還不夠好?!敖酉聛砦覀冞€要加緊訓(xùn)練,不斷完善這些能力?!?/p>
在多模態(tài)生成能力上,文心一言沒有落后于GPT-4。
現(xiàn)場,李彥宏展示了文心一言生成文本、圖片、音頻和視頻的能力。文心一言不僅能夠生成四川話等方言語音,還能通過一段文字自動生成視頻。

不過,視頻生成能力因成本較高,現(xiàn)階段還未對所有用戶開放,未來會逐步接入。
“多模態(tài)是生成式AI一個明確的發(fā)展趨勢?!崩顝┖攴Q,未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力也會不斷提升。
盡管從某種程度上,文心一言具有了對人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性也還算令人滿意。但整體而言,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段。
李彥宏說:“它們有時候會有很驚艷的表現(xiàn),但不少場景下,細(xì)究起來還有明顯的bug,進(jìn)步空間很大?!?/p>
雖然多次提到產(chǎn)品還不完美,但百度仍將自己定位為:全球大廠中第一個做出對標(biāo)ChatGPT產(chǎn)品的企業(yè)。
在李彥宏給出的論據(jù)中,百度獨(dú)具的四層技術(shù)棧優(yōu)勢占據(jù)重要地位。
人類進(jìn)入人工智能時代,IT技術(shù)的技術(shù)棧發(fā)生了根本性變化,從過去三層到“芯片-框架-模型-應(yīng)用”四層。
“而當(dāng)前,百度是全球?yàn)閿?shù)不多、在這四層進(jìn)行全棧布局的人工智能公司。從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動駕駛、小度等應(yīng)用,各個層面都有領(lǐng)先業(yè)界的自研技術(shù)。”李彥宏表示。

在他看來,百度AI全棧布局的優(yōu)勢在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是框架層和模型層之間,有很強(qiáng)的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并顯著降低成本。
“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學(xué)習(xí)、自然語言處理,需要多年的堅持和積累,沒法速成?!崩顝┖暾f。
據(jù)全天候科技了解,大約在一個多月前,百度對外釋放即將發(fā)布文心一言之時,在其內(nèi)部已成立了相關(guān)“項(xiàng)目組”。由CTO王海峰帶隊(duì),李彥宏深度參與,并從多個業(yè)務(wù)線進(jìn)行了人員和資源調(diào)配。
該項(xiàng)目組在內(nèi)部被評價為“相當(dāng)神秘”,未到最后一刻,甚至內(nèi)部員工也無法得知文心一言的具體進(jìn)展。
但對于今天的發(fā)布,李彥宏依然認(rèn)為文心一言是一個“不完美小孩”,“之后,文心一言將建立起真實(shí)用戶反饋、開發(fā)者調(diào)用和模型迭代之間的飛輪,效果會迅速提升,給你‘士別三日,當(dāng)刮目相看’的驚喜?!?/p>
02 對標(biāo)ChatGPT?
趕在百度發(fā)布文心一言的前一天,OpenAI發(fā)布了GPT-4,令A(yù)I達(dá)到了“歷史上前所未有的新高度”。
相較前一代,GPT-4是一個超大的多模態(tài)模型,可接受的文字輸入長度增加到3.2萬個token(大約2.4萬單詞)。同時,它可以接受圖像輸入并理解圖像內(nèi)容。
升級之后,GPT-4在多項(xiàng)基準(zhǔn)考試中表現(xiàn)出的水平和人類相當(dāng)甚至更高。比如:在美國律師資格考試 Uniform Bar Exam、法學(xué)院入學(xué)考試 LSAT、“美國高考”SAT數(shù)學(xué)部分和證據(jù)性閱讀與寫作部分的考試中,它的得分高于88%的應(yīng)試者。
不過,GPT-4也提高了使用門檻,目前還沒有免費(fèi)版本,其訪問權(quán)限僅面向ChatGPT Plus的付費(fèi)訂閱用戶及企業(yè)和開發(fā)者開放。而且,目前GPT-4每4小時只能回答100個問題。
不過,隨著GPT-4能力的增強(qiáng)和更穩(wěn)定不易出錯的性能,也為此后落地商業(yè)化提供了更多的可能性。
在眾多國內(nèi)布局生成式對話產(chǎn)品的公司中,百度被認(rèn)為是最有希望與OpenAI媲美的一家。文心一言是否夠得上與ChatGPT一戰(zhàn)?
李彥宏在發(fā)布會上的表現(xiàn)稱得上謙遜:ChatGPT的門檻還是很高的。文心一言仍算不上完美。

根據(jù)發(fā)布會傳遞的信息,從功能角度出發(fā),二者均具備文學(xué)創(chuàng)作、數(shù)理推算、語義理解、多模態(tài)生成等能力。不過,GPT-4之前宣傳的圖片輸入生成文本仍未向公眾開放,生成圖片及視頻能力也僅僅停留在展示頁面。而文心一言可生成圖片及視頻內(nèi)容。
一位AIGC領(lǐng)域創(chuàng)業(yè)者對全天候科技說:“文心一言不需要碾壓ChatGPT,如果滿分是100分,百度的文心一言只要能做到超過及格線,就很不錯了?!?/p>
在這位創(chuàng)業(yè)者看來,AIGC太重要了,無論國內(nèi)做得如何,都得先推出一個產(chǎn)品。“就像搜索引擎,國外有Google,國內(nèi)就得有百度。”
李彥宏預(yù)測,大語言模型將帶來三大產(chǎn)業(yè)機(jī)會:第一類是新型云計算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS;第二類是進(jìn)行行業(yè)模型精調(diào)的公司;第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商。
即便如此,百度仍然未提及關(guān)于文心一言可行的、清晰的商業(yè)模式及變現(xiàn)方式。然而從可能落地的商業(yè)化場景看,OpenAI已經(jīng)有明確的商業(yè)化模式和變現(xiàn)路徑。
“我們當(dāng)然希望文心一言能更好,因?yàn)槿魏螙|西得有競爭,價格才能打下來。我們公司現(xiàn)在調(diào)用的是OpenAI的接口,調(diào)用頻率還蠻高的。現(xiàn)在我要給OpenAI這筆錢,是因?yàn)槲覜]得選?!鼻笆鯝IGC領(lǐng)域創(chuàng)業(yè)者表示。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

