無(wú)需完美,文心一言已然自證百度
ChatGPT以火箭般的速度爆紅,吹皺了中國(guó)科技圈和創(chuàng)投界的一池春水,引得無(wú)數(shù)人蠢蠢欲動(dòng)?;ヂ?lián)網(wǎng)大佬自掏腰包、帶資建組,科技大廠摩拳擦掌、爭(zhēng)先恐后,創(chuàng)業(yè)公司也不遑多讓,甚至與AI不搭邊的個(gè)別企業(yè)也借勢(shì)營(yíng)銷,并因此而收獲一波股價(jià)的大漲。
時(shí)隔一個(gè)多月再回看,在這場(chǎng)喧囂與騷動(dòng)當(dāng)中,蹭流量和追風(fēng)口者居多,真正躬身入局和實(shí)干者少之又少。目前來(lái)看,在全球大廠中,百度是第一個(gè)站出來(lái)的。
過(guò)去幾年,在國(guó)際科技博弈的宏觀背景之下,科技的自立自強(qiáng)成為全民共識(shí),因此當(dāng)ChatGPT橫掃中國(guó)輿論場(chǎng)時(shí),國(guó)人無(wú)比期盼自己人能開發(fā)出同類產(chǎn)品,并與之掰掰手腕。而過(guò)去10年在AI領(lǐng)域投入超過(guò)1100億元研發(fā)費(fèi)用的百度,自然成為被關(guān)注的對(duì)象。
在外界關(guān)注中,文心一言新聞發(fā)布會(huì)如約而至。3月16日新聞發(fā)布會(huì)上,百度基于大語(yǔ)言模型的生成式AI 產(chǎn)品“文心一言”開啟邀請(qǐng)測(cè)試。首批用戶即可通過(guò)邀請(qǐng)測(cè)試碼,在文心一言官網(wǎng)體驗(yàn)產(chǎn)品。百度后續(xù)將陸續(xù)開放給更多用戶,企業(yè)客戶可以通過(guò)API接口調(diào)用服務(wù),申請(qǐng)接入并體驗(yàn)文心一言的能力。
人有我也有,人有我更優(yōu)
此前,各類人工智能產(chǎn)品普遍都是“人工智障”。而ChatGPT卻出乎意料的聰明,能成為人們學(xué)習(xí)、工作、生活當(dāng)中的實(shí)用工具,甚至取代部分學(xué)習(xí)、工作、勞動(dòng)(當(dāng)然,倫理問(wèn)題另說(shuō))。AI從“人工智障”到“說(shuō)人話”“干人事”的進(jìn)階背后,正是得益于大語(yǔ)言模型所具備的通用性和泛化性。
但是,搞大語(yǔ)言模型不是請(qǐng)客吃飯,拼的是真刀真槍的強(qiáng)投入和硬實(shí)力,海量多維度的大數(shù)據(jù)、頂尖的算法、強(qiáng)勁的算力、出色的產(chǎn)品和豐富且深入的場(chǎng)景缺一不可。正因?yàn)槿绱耍笳Z(yǔ)言模型的研發(fā)門檻極高。
百度持續(xù)十年研發(fā)投入超過(guò)1100億元,長(zhǎng)期的投入讓它在芯片層(高端芯片昆侖芯)、框架層(飛槳)、模型層(文心預(yù)訓(xùn)練大模型)和應(yīng)用層(產(chǎn)品在諸多場(chǎng)景應(yīng)用)實(shí)現(xiàn)了全棧布局,且擁有關(guān)鍵自研技術(shù)。
基于這樣的積累,百度在2019年便推出了知識(shí)增強(qiáng)的語(yǔ)義理解框架ERNIE(文心大模型)。經(jīng)過(guò)多次迭代,文心大模型已具備較強(qiáng)的泛化能力和性能。根據(jù)IDC在2023年2月發(fā)布的《2022中國(guó)大模型發(fā)展白皮書》,在國(guó)內(nèi)9家主流廠商的大語(yǔ)言模型當(dāng)中,百度文心大模型位于第一梯隊(duì),產(chǎn)品能力、生態(tài)能力、應(yīng)用能力全面領(lǐng)先。
而此次百度基于大語(yǔ)言模型推出的生成式AI產(chǎn)品文心一言,具備包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成在內(nèi)的多項(xiàng)通用能力,不僅做到了整體上的“人有我有”,還在某些局部做到了“人有我優(yōu)”。
01-能寫能創(chuàng)作
對(duì)于ChatGPT,大多數(shù)普通用戶的直觀感受,除了它什么問(wèn)題都接得住并反饋相對(duì)得體的回答之外,便是擁有出色的寫作能力,包括模仿知名詩(shī)人的風(fēng)格創(chuàng)作詩(shī)歌,為一篇新聞稿件取標(biāo)題,或者根據(jù)關(guān)鍵詞寫文章等等。
作為中國(guó)市場(chǎng)第一個(gè)公開發(fā)布的基于大語(yǔ)言模型的生成式AI產(chǎn)品,文心一言在寫作這樣的通用能力上,并不落于下風(fēng)。
基于20多年搜索業(yè)務(wù)的積累,百度已建立起世界上最大的知識(shí)圖譜,包含50億實(shí)體、5500億級(jí)事實(shí),每天調(diào)用量超過(guò)400億次。知識(shí)圖譜以結(jié)構(gòu)化的形式描述真實(shí)世界中的實(shí)體、屬性、關(guān)系等,是機(jī)器認(rèn)知世界的重要基礎(chǔ)。
由于訓(xùn)練數(shù)據(jù)包括萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù),數(shù)十億搜索數(shù)據(jù)和圖片數(shù)據(jù),百億級(jí)語(yǔ)音日均調(diào)用數(shù)據(jù),以及上述知識(shí)圖譜,因此文心一言大模型在中文語(yǔ)言的處理上處于獨(dú)一無(wú)二的位置,尤其是在自然語(yǔ)言問(wèn)答和創(chuàng)意內(nèi)容生成上有突出表現(xiàn)。因而,不管是文學(xué)創(chuàng)作,還是商業(yè)文本寫作,都難不倒文心一言。
在發(fā)布會(huì)現(xiàn)場(chǎng),百度播放了文心一言的人機(jī)互動(dòng)視頻(百度創(chuàng)始人李彥宏解釋,由于互動(dòng)過(guò)程略微耗時(shí),因此百度提前將互動(dòng)過(guò)程提前錄制成視頻)。根據(jù)現(xiàn)場(chǎng)視頻,在文學(xué)創(chuàng)作場(chǎng)景中,文心一言對(duì)科幻小說(shuō)《三體》的核心內(nèi)容進(jìn)行了總結(jié),提出了五個(gè)續(xù)寫的建議角度,體現(xiàn)出對(duì)話問(wèn)答、總結(jié)分析、內(nèi)容創(chuàng)作生成的綜合能力。同時(shí),它準(zhǔn)確回答了《三體》作者、電視劇角色扮演者等事實(shí)性問(wèn)題。此外,面對(duì)“于和偉和張魯一有哪些共同點(diǎn)”“于和偉和張魯一誰(shuí)更高”這類問(wèn)題,文心一言也基于推理能力得出了正確答案。
而在商業(yè)文案創(chuàng)作場(chǎng)景中,文心一言順利完成了給公司起名、寫Slogan、寫新聞稿的創(chuàng)作任務(wù)。
02-能邏輯推理
邏輯思維能力是一個(gè)人最重要的能力之一。而在人工智能流域,邏輯推理能力屬于認(rèn)知智能層面,相較于計(jì)算智能和感知智能,認(rèn)知智能更為復(fù)雜,因此也成為人工智能研究的重點(diǎn)領(lǐng)域。
雖然OpenAI自己承認(rèn),新發(fā)布的GPT-4仍然會(huì)產(chǎn)生幻覺(jué)、生成錯(cuò)誤答案,并出現(xiàn)推理錯(cuò)誤,但它還是展現(xiàn)出出色的邏輯推理能力。比如當(dāng)用戶提問(wèn)“格魯吉亞和西亞的平均每日肉類消費(fèi)量總和是多少?”,并要求GPT-4在回答前提供循序漸進(jìn)的推理過(guò)程時(shí),GPT-4便提供了解題的步驟,并且最終準(zhǔn)確地給出答案。
而受益于百度知識(shí)圖譜,文心大模型也成為了全球首個(gè)知識(shí)增強(qiáng)千億大模型。研究表明,數(shù)據(jù)規(guī)模越大,尤其是當(dāng)參數(shù)達(dá)到千億級(jí),大模型就可能發(fā)生“智能涌現(xiàn)”,涌現(xiàn)出知識(shí)和邏輯推理能力。這也使得文心一言擁有了數(shù)理邏輯推算能力,在學(xué)習(xí)一些標(biāo)準(zhǔn)的解題思路后,能把問(wèn)題拆分成多個(gè)子問(wèn)題,一步步推理來(lái)解答,從而給出正確的答案、避免一些錯(cuò)誤。
現(xiàn)場(chǎng)視頻中,面對(duì)“雞兔同籠”這類鍛煉人類邏輯思維的經(jīng)典題,文心一言不僅能理解題意,而且還給出了正確的解題思路,進(jìn)而像學(xué)生做題一樣,按正確的步驟,一步步算出正確答案。
03-能擬人化
在人類社會(huì),人際交流是通過(guò)聲音、文字、圖像等感知交互方式的融合實(shí)現(xiàn)與完成,比父子對(duì)話,雙方不僅僅是聽(tīng)對(duì)方的聲音、識(shí)別其中的文字,還會(huì)看對(duì)方的表情,甚至肢體動(dòng)作。
人工智能則是計(jì)算機(jī)通過(guò)對(duì)文本、圖片、視頻和音頻等不同儲(chǔ)存信息載體的認(rèn)知和理解,結(jié)合環(huán)境因素來(lái)模擬人與人之間的交互方式。想讓人工智能更理解人類世界,最優(yōu)辦法就是讓AI成功理解多模態(tài)信息,并對(duì)此類信息形成分析、推理的邏輯和生成新信息的能力。
OpenAI在北京時(shí)間3月15日凌晨舉辦的發(fā)布會(huì)中有這樣一個(gè)場(chǎng)景:OpenAI聯(lián)合創(chuàng)始人兼總裁Greg Brockman在草稿本上用紙筆畫出一張非常粗糙的草圖,拍照并上傳,GPT-4僅用時(shí)10秒左右,就直接生成了網(wǎng)站代碼。在發(fā)布會(huì)的演示中,GPT-4不僅是能分析匯總圖文圖標(biāo),甚至還能讀懂梗圖,指出梗在哪里、解釋為啥好笑。但令人遺憾的是,GPT-4標(biāo)榜的圖片輸入生成文本并未向公眾開放,生成圖片及視頻能力也僅僅停留在展示頁(yè)面。
而文心大模型歷經(jīng)多次迭代,在更早之前也已經(jīng)從單一的自然語(yǔ)言理解延伸到多模態(tài),包括視覺(jué)、文檔、文圖、語(yǔ)音等多模態(tài)多功能,擁有出色的“擬人化”功能,并且在多項(xiàng)權(quán)威測(cè)評(píng)中都取得出色的成績(jī)。比如跨模態(tài)文檔智能大模型ERNIE-Layout,基于布局知識(shí)增強(qiáng)技術(shù),融合文本、圖像、布局等信息進(jìn)行聯(lián)合建模,在文檔抽取、布局理解等5類11項(xiàng)任務(wù)刷新業(yè)界SOTA(在該項(xiàng)研究任務(wù)中,目前最好/最先進(jìn)的模型);而作為業(yè)界首個(gè)融合場(chǎng)景圖知識(shí)的多模態(tài)預(yù)訓(xùn)練模型,ERNIE-VIL在視覺(jué)常識(shí)推理、跨模態(tài)圖像檢索、跨模態(tài)文本檢索等典型多模態(tài)任務(wù)中刷新了世界紀(jì)錄。
演示視頻也展示了文心一言生成文本、圖片、音頻和視頻的能力,其中在將文字轉(zhuǎn)音頻環(huán)節(jié),它講的是四川話。李彥宏表示,文心一言還能講廣東話、閩南話等。生成圖片、音頻能力,文心一言開箱即可使用。而視頻生成成本較高,現(xiàn)階段文心一言目前尚未對(duì)所有用戶開放,不過(guò)未來(lái)會(huì)逐步接入。隨著百度多模態(tài)大模型的迭代升級(jí),文心一言的多模態(tài)生成能力無(wú)疑也將持續(xù)提升。
04-更懂中文
如果說(shuō)到“人有我優(yōu)”, 文心一言最顯著的亮點(diǎn)和差異化優(yōu)勢(shì),無(wú)疑還是它更懂中文。
中文是世界上最難學(xué)習(xí)的語(yǔ)言之一,不僅漢字、詞匯的數(shù)量遠(yuǎn)多于其他語(yǔ)言,而且每個(gè)字、詞的意思也極為繁多。正如那個(gè)關(guān)于“意思”的段子,同樣的詞匯,在每一句話中,背后所蘊(yùn)藏的含義都不一樣。
過(guò)去20多年,百度憑借著毫不遜色的技術(shù)實(shí)力和更懂中文的優(yōu)勢(shì),長(zhǎng)期占據(jù)著中文搜索引擎市場(chǎng)絕對(duì)霸主的王座。而作為扎根于中國(guó)市場(chǎng)的大語(yǔ)言模型推出的生成式AI產(chǎn)品,文心一言自然具備了中文領(lǐng)域最先進(jìn)的自然語(yǔ)言處理能力。這種能力表現(xiàn)為對(duì)中文語(yǔ)言的理解,以及對(duì)中國(guó)文化的理解。
截至目前,文心一言已刷新93個(gè)中文NLP(自然語(yǔ)言處理)任務(wù)基準(zhǔn),并多次登頂SuperGLUE全球榜(由谷歌DeepMind、Facebook研究院、紐約大學(xué)、華盛頓大學(xué)等多個(gè)權(quán)威機(jī)構(gòu)聯(lián)合發(fā)布的復(fù)雜語(yǔ)言理解任務(wù)評(píng)測(cè)),已在機(jī)器閱讀理解、文本分類、語(yǔ)義相似度計(jì)算等60多項(xiàng)任務(wù)中實(shí)際應(yīng)用。
在現(xiàn)場(chǎng)展示中,文心一言正確解釋了成語(yǔ)“洛陽(yáng)紙貴”的含義、“洛陽(yáng)紙貴”對(duì)應(yīng)的經(jīng)濟(jì)學(xué)理論,還用“洛陽(yáng)紙貴”四個(gè)字創(chuàng)作了一首藏頭詩(shī),全面展現(xiàn)了其對(duì)中文的理解、運(yùn)用能力。
當(dāng)然,由于“母語(yǔ)”和“語(yǔ)言環(huán)境”是中文,文心一言對(duì)英文的處理能力,不如中文好。李彥宏也承認(rèn)了這一點(diǎn),不過(guò)現(xiàn)場(chǎng)并沒(méi)有進(jìn)行演示。
李彥宏認(rèn)為,從文心一言的表現(xiàn)看,某種程度上它具有了對(duì)人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性都逐漸接近人類水平。當(dāng)然,他也承認(rèn),整體而言,這類大語(yǔ)言模型還遠(yuǎn)未到發(fā)展完善的階段,有賴于通過(guò)真實(shí)的用戶反饋而逐步迭代。
不過(guò),從基礎(chǔ)通用的寫作、創(chuàng)作能力,到進(jìn)階的邏輯推理推算能力,從單一的自然語(yǔ)言處理到多模態(tài)多功能,在整體上,文心一言并沒(méi)有明顯短板。而這,已經(jīng)不容易了。
為己,更利他
毫無(wú)疑問(wèn),不管是大語(yǔ)言模型、生成式AI,還是由此而開發(fā)出的ChatGPT、文心一言,在技術(shù)上都足夠酷,但相比于技術(shù)本身,技術(shù)的應(yīng)用和影響才是更多人關(guān)心的話題。
作為百度積累多年潛心打造的重大產(chǎn)品,文心一言首先將從整體上重塑百度的業(yè)務(wù),為其帶來(lái)全新的想象空間。
先說(shuō)搜索。隨著大語(yǔ)言模型的問(wèn)世和優(yōu)化,搜索引擎將從“模糊搜索”升級(jí)為“精準(zhǔn)推送”,創(chuàng)造全新的使用體驗(yàn),帶來(lái)顯著的效率提升。用微軟CEO Satya Nadella的話說(shuō),“搜索引擎迎來(lái)了新的時(shí)代”。李彥宏也直言,“這將重塑信息的生成和呈現(xiàn)方式,有機(jī)會(huì)形成新的流量入口,幫助我們吸引更多的用戶,并獲得市場(chǎng)份額。”而伴隨著搜索的升級(jí),百度整個(gè)內(nèi)容生態(tài)也將發(fā)生質(zhì)變。
其次,文心一言也將與百度更多業(yè)務(wù)整合,從而激活整體業(yè)務(wù)的發(fā)展,重塑百度的想象空間。
百度方面曾表示,作為基于百度智能云技術(shù)打造出來(lái)的大模型,文心一言將根本性地改變?cè)剖袌?chǎng)的游戲規(guī)則——以前企業(yè)選擇云廠商更多是看算力、存儲(chǔ)等基礎(chǔ)云服務(wù),而以后企業(yè)對(duì)云的需求會(huì)更加聚焦智能服務(wù),將更多關(guān)注框架、模型,以及模型-框架-芯片-應(yīng)用這四層架構(gòu)之間的協(xié)同。因此,借助文心一言的能力,云服務(wù)將從數(shù)字時(shí)代躍遷到智能時(shí)代,而智能化對(duì)各行各業(yè)效率的提升也將顯著顯現(xiàn)。
此外,百度還將文心一言搭載到Apollo智艙系列產(chǎn)品,提升智能汽車的人車交互體驗(yàn),與小度進(jìn)行集成、讓小度更加聰明和善解人意。
過(guò)去,人工智能面臨大規(guī)模落地應(yīng)用的挑戰(zhàn),究其原因就在于開發(fā)門檻高、應(yīng)用場(chǎng)景復(fù)雜多樣、對(duì)場(chǎng)景標(biāo)注數(shù)據(jù)依賴等問(wèn)題突出。而如今,大語(yǔ)言模型憑借其優(yōu)越的泛化性、通用性、遷移性,為人工智能大規(guī)模落地帶來(lái)新的希望。IDC預(yù)測(cè),未來(lái),大模型將帶動(dòng)新的產(chǎn)業(yè)和服務(wù)應(yīng)用范式,在深度學(xué)習(xí)平臺(tái)的支撐下將成為產(chǎn)業(yè)智能化基座。
對(duì)于文心一言,百度不僅僅將其定位為自身的模型內(nèi)部產(chǎn)品,而是將其視為人工智能基座型的賦能平臺(tái),希望通過(guò)新技術(shù)幫助千行百業(yè)實(shí)現(xiàn)智能化變革、效率提升,獲得更強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。用李彥宏在發(fā)布會(huì)現(xiàn)場(chǎng)的話說(shuō),“文心一言讓每一家公司可以離客戶更近?!?/p>
與行業(yè)頭部企業(yè)聯(lián)合研發(fā)融合行業(yè)數(shù)據(jù)、知識(shí)以及專家經(jīng)驗(yàn)的行業(yè)大模型,是百度推進(jìn)大模型深入產(chǎn)業(yè)落地的主要方式。目前,百度文心大模型已經(jīng)在電力、金融、媒體等領(lǐng)域,發(fā)布了10多個(gè)行業(yè)大模型。作為AI底座,這些行業(yè)大模型在各行業(yè)幫助合作伙伴在產(chǎn)品創(chuàng)新、生產(chǎn)流程變革、降本增效等維度實(shí)現(xiàn)突破,產(chǎn)生價(jià)值。
例如,百度與TCL合作的CV大模型,面向多個(gè)產(chǎn)線多個(gè)環(huán)節(jié)的工業(yè)質(zhì)檢提供AI基座能力,在TCL幾個(gè)產(chǎn)線檢測(cè)mAP指標(biāo)平均提升10%+,訓(xùn)練樣本減少到原有訓(xùn)練樣本30%~40%,產(chǎn)線指標(biāo)即可達(dá)到原有產(chǎn)線效果,新產(chǎn)線冷啟動(dòng)效率可提升3倍,產(chǎn)線上線開發(fā)周期降低30%。
結(jié)語(yǔ)
在面向百度全員的財(cái)報(bào)信中,李彥宏寫道,“生成式AI和大模型的智能涌現(xiàn),是全新的計(jì)算范式帶來(lái)的新機(jī)會(huì)。這意味著,AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變?!?/strong>
盡管在短短數(shù)月時(shí)間內(nèi),包括ChatGPT在內(nèi)的大語(yǔ)言模型產(chǎn)品給世人帶來(lái)了前所未有的震撼,AI還在持續(xù)快速迭代進(jìn)化,不管對(duì)OpenAI、百度,還是對(duì)人工智能行業(yè),亦或是整個(gè)數(shù)字經(jīng)濟(jì)來(lái)說(shuō),一切其實(shí)才剛剛開始。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

