91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

對(duì)話阿里云CTO周靖人:“通義千問”不是起點(diǎn)也不是終點(diǎn)

商界觀察
2023-04-10

4月7日,阿里巴巴旗下大語言模型——“通義千問”開啟邀測(cè)。

 

開發(fā)“通義千問”的阿里巴巴達(dá)摩院如是解釋這款大語言模型的命名:“千問,千萬次的問,千萬的學(xué)問,能問出千問的一定是真愛,能回答千問的,也一定是真有學(xué)問,以及,AI和我們一樣,都有千萬次交互的熱情。”

 

而在使用邀請(qǐng)碼對(duì)大模型產(chǎn)品測(cè)試了一天后,我們也有機(jī)會(huì)和它背后的負(fù)責(zé)人,阿里云智能CTO周靖人進(jìn)行了一次獨(dú)家對(duì)話,提出了我們的“千問”。

 

以下為對(duì)話實(shí)錄:

 

“通義千問”不是起點(diǎn)也不是終點(diǎn),而是既定路線上的一個(gè)節(jié)點(diǎn)

 

品玩:我們今天一直在使用通義千問,它的許多特點(diǎn)讓我們印象深刻,網(wǎng)上也有了很多對(duì)產(chǎn)品的測(cè)試,我們很好奇你們會(huì)怎么測(cè)試它,如何判斷它的表現(xiàn)?

 

周靖人:怎么去全面評(píng)測(cè)一個(gè)大模型本身是非常有挑戰(zhàn)的。其實(shí)今天整個(gè)行業(yè)還沒有一個(gè)標(biāo)準(zhǔn)。甚至每個(gè)人的評(píng)價(jià)其實(shí)也是很主觀的,對(duì)吧?

 

有時(shí)候更多的是說,讓模型能面對(duì)你的一些回復(fù),揣測(cè)到你到底是喜歡哪一種說話的方式,然后會(huì)不斷去調(diào)整,這本身就是模型在理解方面的一個(gè)能力。

 

我們會(huì)有一系列的評(píng)測(cè),其中簡(jiǎn)單的測(cè)試包括一些創(chuàng)作,一些文案的續(xù)寫,一些簡(jiǎn)單的推理,甚至一些簡(jiǎn)單的數(shù)學(xué)。包括今天跟一些多模態(tài)的延展,還有一些知識(shí)增強(qiáng)的測(cè)試。

 

現(xiàn)在我們內(nèi)部是有一個(gè)測(cè)試集,而慢慢以后都會(huì)從讓人去評(píng)價(jià)一個(gè)模型,變成用模型去評(píng)價(jià)一個(gè)模型本身,我們一定會(huì)走到這一步。

 

品玩:那么如果對(duì)標(biāo)ChatGPT,通義千問現(xiàn)在是什么水平?

 

周靖人:我們要承認(rèn)ChatGPT尤其是GPT4目前還是非常領(lǐng)先的。我覺得這是一個(gè)正常的過程。

 

但直接對(duì)比的話,這也很難評(píng)價(jià)。我們關(guān)注的是如何能夠讓我們的模型彌補(bǔ)自己的不足,甚至在更多的一些場(chǎng)景里面有突出的一些能力的表現(xiàn)。今天所有的模型離我們真正去模擬人類的智慧體還有很遠(yuǎn)的距離。

 

品玩:阿里并不是因?yàn)镃hatGPT的出現(xiàn)才開始密集投入大模型的,之前也展示過很多模型研究的進(jìn)展,那“通義千問”在阿里的大模型研究歷程里是什么位置?

 

周靖人:這個(gè)產(chǎn)品是我們的一個(gè)中間態(tài)。

 

今天我們?cè)诓粩嗵剿骰诙嗄B(tài)的大模型的路徑上,或者說接近于多模態(tài)真正的趨近人類智慧體的路徑上的一個(gè)節(jié)點(diǎn)。它不是起點(diǎn)也不是終點(diǎn),是個(gè)既定路線上的節(jié)點(diǎn)。我們這次是把過去積累的一部分工作向社會(huì),向開發(fā)者開放,但我們?cè)谶@方面還有長(zhǎng)足的工作,需要進(jìn)一步地去突破去創(chuàng)新。

 

品玩:盡管你強(qiáng)調(diào)多模態(tài),但我們注意到這一次并沒有提供文生圖的功能。

 

周靖人:對(duì),很多公司在做文生圖,其實(shí)達(dá)摩院也有相關(guān)的一系列工作發(fā)表了,像我們的Composer模型等,不光能夠做文生圖,還可以根據(jù)你的一些詳細(xì)指令去修改這個(gè)圖。所以給通義千問接入文生圖并不是最難的,它更多是一個(gè)工程上的問題。

 

我們其實(shí)認(rèn)為,今天更難的是把各個(gè)模態(tài)的模型能力融入進(jìn)一個(gè)模型,比如怎么把視覺的能力融入到語言模型里面。因?yàn)橐粋€(gè)人獲取知識(shí)的方式有視覺、語言、聽覺等,不會(huì)把它們用獨(dú)立的形態(tài)分割開來,在人腦里它都是一個(gè)可貫通的知識(shí)體,能夠把不同形式的輸入有機(jī)的聯(lián)合在一起。今后的多模態(tài)必然能夠做到,不管是任何一個(gè)模態(tài)來的信息,你的知識(shí)體系或者接受到的信號(hào)都能夠在一個(gè)高維的空間里有機(jī)融合在一起。

 

我覺得這個(gè)是必然會(huì)發(fā)生的。這個(gè)也是接下來GPT4或5一定會(huì)有突破的地方,我們也在這方面有不少的投入,也是我們認(rèn)準(zhǔn)的一個(gè)重要方向。

 

品玩:也就是說阿里的大模型路線,是多模態(tài)的一張藍(lán)圖繪到底,而這些都是計(jì)劃的一部分。

 

周靖人:我們從 2019 年就開始嘗試各種各樣的大模型,從StructBERT到M6,再到PLUG再到最新的Composer等一系列視覺模型,其實(shí)本質(zhì)都是在預(yù)訓(xùn)練大模型的整體思路上不斷進(jìn)行探索,不斷創(chuàng)新。

 

我認(rèn)為今天大模型其實(shí)在不斷地逼近我們?nèi)说闹腔?。人的智慧很重要的一點(diǎn)就來自于語言,LLM(large language model )開始能根據(jù)自然語言理解有效地提取人類大量的知識(shí)體系,在這方面是非常獨(dú)特的。

 

今天我們看到類似ChatGPT,類似通義千問所表現(xiàn)出來的一些能力,其實(shí)都是在這條道路上。所以對(duì)我們行業(yè)內(nèi)的人來講,我們并不認(rèn)為這條道路好像就是2023 年突然出現(xiàn)。我們認(rèn)為這是一個(gè)長(zhǎng)期以來技術(shù)發(fā)展的演進(jìn)過程。甚至我們認(rèn)為今天看到的所謂大模型的能力也都是冰山一角,今后還會(huì)有整體更驚人的一系列表現(xiàn)。

 

我認(rèn)為ChatGPT的推出,更重要的是教育了整個(gè)社會(huì)。上一次半年前我們聊到大模型的時(shí)候,可能連科技界部分工作者都還不看好這條路線。今天 ChatGPT 基于 Chat 這樣一個(gè)產(chǎn)品的形態(tài)做得非常出色,把相關(guān)的能力有效地表達(dá)出來了,不光是對(duì)模型一線的工作者,更多是讓大眾和各行各業(yè)的人都突然有如夢(mèng)驚醒的感覺。甚至,今天它給我們整個(gè)計(jì)算機(jī)科學(xué)領(lǐng)域都帶來了一個(gè)驚訝的反應(yīng),或者說快速的教育過程,大家快速認(rèn)識(shí)到基于一個(gè)智慧體的預(yù)訓(xùn)練大模型會(huì)有多么出色的表現(xiàn)。

 

在這個(gè)過程中間,我們對(duì)ChatGPT所采用的一些技術(shù)和各個(gè)方面能夠達(dá)到的驚艷效果也是感到出乎意料。但阿里不是說今天有了ChatGPT,我們才加入這樣一個(gè)陣列,或者說我們才能湊熱鬧,也來做一把模型。其實(shí)我們?cè)谶@方面一直在積累,應(yīng)該說是國(guó)內(nèi)最早探索大模型方向的公司之一。

 

ChatGPT非常領(lǐng)先,但下次也許就是我們?cè)谝I(lǐng)技術(shù)的發(fā)展

 

品玩:所以對(duì)大模型而言,ChatGPT究竟改變了什么?

 

周靖人:它基于SFT(有監(jiān)督精調(diào)),包括基于reinforcement learning(強(qiáng)化學(xué)習(xí)) 的調(diào)優(yōu)方式讓人眼前一亮。

 

今天其實(shí)我們回過頭去看,模型中融入知識(shí)的潛力是巨大的,但是在InstructGPT 出來之前,其實(shí)缺乏一個(gè)有效的手段把這方面的能力釋放出來。現(xiàn)在這些技術(shù)的使用能更有效地把模型作為知識(shí)體的能力釋放出來,快速地去解決一些具體的問題。

 

品玩:這對(duì)大模型研究路線有什么影響?

 

周靖人:首先,ChatGPT包括InstructGPT給我們很多啟發(fā),我相信 OpenAI 其實(shí)有長(zhǎng)足的技術(shù)前瞻性,當(dāng)他發(fā)布GPT3. 0 或者 3. 5 版本的時(shí)候,實(shí)際上是各個(gè)方面都陸陸續(xù)續(xù)已經(jīng)準(zhǔn)備好了。

 

但最終我們認(rèn)為類似人類智慧體的預(yù)訓(xùn)練大模型一定是多模態(tài)的。我們長(zhǎng)期以來在這方面做投入,因此ChatGPT的誕生并沒有讓我們轉(zhuǎn)變投入方向。后來GPT4的發(fā)布其實(shí)在無形之中驗(yàn)證了大家實(shí)看法比較一致——AI會(huì)朝著多模態(tài)的體系進(jìn)一步發(fā)展。

 

所以今天我們方向是一致的,在實(shí)現(xiàn)路徑上我們要取長(zhǎng)補(bǔ)短,這是科技發(fā)展的必經(jīng)之路。今天ChatGPT有一些很出色的工作,我們要把他們的一系列工作和一些進(jìn)展融入到我們技術(shù)路線里面來。

 

品玩:如何看AI行業(yè)的議程正在被ChatGPT設(shè)置這個(gè)事實(shí),就是說無論其它玩家做什么,都會(huì)被拿來跟ChatGPT做對(duì)標(biāo)。

 

周靖人:我覺得這就是科技的魅力。

 

這種你追我趕是今天科技健康發(fā)展的必經(jīng)之路。任何一個(gè)科技都是處于你追我趕中,今天可能我有一些新的想法,能把科技再往前推一步,那下一次有可能是由你來承擔(dān)這方面的一些創(chuàng)新,大家都是在互相取長(zhǎng)補(bǔ)短,不斷的去推進(jìn)科技前進(jìn)。

 

在不斷取長(zhǎng)的過程里,我們也不能妄自菲薄,我們同樣也希望能不斷地去推進(jìn)最先進(jìn)的技術(shù)進(jìn)步,下次也許就是我們?cè)谕苿?dòng)行業(yè)的發(fā)展。只有這樣人類的整體科技才能不斷地提升,不斷的創(chuàng)新,不斷地進(jìn)行突破。

 

至于今天整個(gè) OpenAI 已經(jīng)在給我們?cè)O(shè)置議程,我覺得那是因?yàn)樗穷I(lǐng)先者,這必須承認(rèn),而接下來,如何能快速追趕上,如何能快速地去迭代模型將成為一個(gè)制勝的關(guān)鍵。

 

也就是說今天我們不乏有一些新的想法,那今天我如何能夠去嘗試?如果說每一次的嘗試它需要花的時(shí)間是幾個(gè)月甚至更長(zhǎng),那今天你整個(gè)的創(chuàng)新速度是跑不起來的。

 

品玩:它變成了一個(gè)系統(tǒng)效率的比拼。

 

周靖人:今天創(chuàng)新迭代的速度一方面需要我們有一些新的想法,但更重要的是需要今天云的基礎(chǔ)設(shè)施。它能夠讓我們?nèi)タ焖俚厝L試,去試錯(cuò),能夠快速拿到反饋,才能讓科技創(chuàng)新不斷加速。

 

我們講它是一個(gè)全方位的競(jìng)爭(zhēng),不單單是說今天是模型本身的競(jìng)爭(zhēng),其實(shí)今天它既是研究又是工程,是從云的基礎(chǔ)設(shè)施到 AI 算法,到今天數(shù)據(jù)處理,全方位的一個(gè)競(jìng)爭(zhēng),甚至涉及到了今天我們計(jì)算機(jī)科學(xué)的方方面面。有各種各樣的分布式系統(tǒng)重啟、底層的網(wǎng)絡(luò)存儲(chǔ)各個(gè)方面都會(huì)涉及到。那之所以 OpenAI 能夠做出非常出色的工作,也來源于今天它跟微軟 Azure 的有機(jī)結(jié)合,其實(shí)在無形之中也是強(qiáng)聯(lián)合,能夠不斷通過云的基礎(chǔ)設(shè)施,通過整個(gè)系統(tǒng)的一系列優(yōu)化帶動(dòng)了今天OpenAI不斷創(chuàng)新的速度。

 

我認(rèn)為在這一場(chǎng)競(jìng)爭(zhēng)里面,是一個(gè)公司全方位能力的一個(gè)表現(xiàn),如果在任何一個(gè)環(huán)節(jié)稍微落后一點(diǎn),都會(huì)在整個(gè)競(jìng)爭(zhēng)上處于劣勢(shì)。

 

“通義千問”其實(shí)是一個(gè)MaaS(模型即服務(wù))的底座

 

品玩:也就是可能這個(gè)模型并沒有完全成熟,但是它也需要先投入到一個(gè)真實(shí)甚至是一個(gè)商業(yè)的環(huán)境中去。今天模型的研發(fā)跟行業(yè)的應(yīng)用已經(jīng)在并行進(jìn)行。

 

周靖人:對(duì),人們逐漸認(rèn)識(shí)到基于大模型本身強(qiáng)大的對(duì)知識(shí)理解和推理能力,找到一個(gè)如SFT和Prompt等方向后,就能夠把小宇宙慢慢釋放出來。那當(dāng)然會(huì)激發(fā)基于大模型的一系列模型應(yīng)用。

 

今天一定程度上人工智能業(yè)務(wù)算法的算法體系已經(jīng)在改變,今后大家要慢慢學(xué)會(huì)怎么在大模型上去做二次的開發(fā),去做相關(guān)的一系列算法和工作,包括把它適配到不同的場(chǎng)景。

 

去年我們?cè)趪?guó)內(nèi)首次推出 model as a service模型即服務(wù)(MaaS),甚至我們是在全球第一個(gè)提出來這樣一個(gè)概念。那我們也比較欣慰的看到越來越多的行業(yè)、云計(jì)算廠商還有更多的互聯(lián)網(wǎng)公司也開始認(rèn)同這樣的一個(gè)觀點(diǎn),甚至今天也開始按照這樣一個(gè)觀點(diǎn)去打造自己的產(chǎn)品服務(wù)體系。我們已經(jīng)已經(jīng)真正進(jìn)入到了一個(gè)模型的世界。

 

品玩:那么MaaS會(huì)讓我們和OpenAI走上不同的演進(jìn)道路么?

 

周靖人:我們認(rèn)為今后 AI 的開發(fā)門檻會(huì)越來越低,我們期待的是連小學(xué)生也能用各種模型進(jìn)行開發(fā)。今后我們需要形成的是一個(gè)一個(gè)模型的不同層級(jí)的結(jié)構(gòu)。

 

而且一個(gè)通用的模型其實(shí)也很難解決所有問題。從開發(fā)者的角度,它會(huì)更多的以模型為第一思考的角度和元素,也就是說今天圍繞著模型作開發(fā)的范式會(huì)逐漸誕生。我們?nèi)ツ暝贑hatGPT出來之前就提出并一直在強(qiáng)調(diào) MaaS,其實(shí)就是這樣一個(gè)理念背后的一系列的思考。

 

我們?cè)谒伎寄P偷纳鷳B(tài)如何快速發(fā)展,所以提出MaaS,為了加速M(fèi)aaS,我們又創(chuàng)建了“魔搭”這樣的社區(qū)。所以幾乎這些工作都是相互強(qiáng)關(guān)聯(lián)的,是在我們整個(gè)AI戰(zhàn)略和模型戰(zhàn)略的主線上。

 

品玩:通義千問其實(shí)也就是MaaS的成果之一,對(duì)吧。

 

周靖人:是的,今天通義千問是以對(duì)話作為一個(gè)能力的表現(xiàn)形式,但我們期待一些企業(yè)級(jí)的應(yīng)用誕生在上面,也就是說今天真正把通義千問模型作為MaaS上面的一個(gè)底座,能夠在上面進(jìn)行額外的開發(fā),能夠真正應(yīng)用到一些各行各業(yè)的場(chǎng)景里面去。那這樣就是真正意義上形成了MaaS。

 

達(dá)摩院支持別人在阿里云上開發(fā)大語言模型

 

品玩:也就是在阿里云上別人也可以開發(fā)自己的模型。

 

周靖人:我們是非常歡迎的。我們并不認(rèn)為今天大模型是一家獨(dú)大。

 

我們希望阿里云能夠?yàn)榇蠹姨峁┮粋€(gè)高效的算力,不簡(jiǎn)簡(jiǎn)單單是一個(gè)算力的數(shù)字,而是能夠把這部分的基礎(chǔ)設(shè)施更好地提供給我們中國(guó)的創(chuàng)業(yè)公司,幫助他們?cè)?AI 方面實(shí)現(xiàn)自己的創(chuàng)新,這樣才能讓中國(guó)整體的 AI 能力有一個(gè)全方位的提升。

 

品玩:其實(shí)我們對(duì)于初創(chuàng)公司做模型這件事情,整個(gè)達(dá)摩院包括整個(gè)阿里的態(tài)度其實(shí)是相當(dāng)開放的?

 

周靖人:對(duì)。

 

品玩:那初創(chuàng)公司做大模型呢?你們?cè)趺纯矗?/strong>

 

周靖人:我覺得對(duì)待大模型,我們科技界一定是要保持開放的心態(tài),對(duì)吧?因?yàn)楹芏嗟膭?chuàng)新來自許多新的想法,其實(shí)這個(gè)我們很難說處于一個(gè)壟斷的狀態(tài)。

 

阿里應(yīng)該說在這方面非常開放,我們?cè)敢獍盐覀兊哪P凸┐蠹沂褂?,另外一方面我們也把我們模型所依賴的這樣一個(gè)云的能力也對(duì)外進(jìn)行服務(wù)。雖然我們也認(rèn)識(shí)到今天小公司在訓(xùn)練大模型的經(jīng)費(fèi)和技術(shù)上有門檻,但我覺得這個(gè)是問題本身的特點(diǎn)所帶來的。我們希望有更多的參與者不斷地加入到這方面的科技創(chuàng)新。

 

賣個(gè)關(guān)子,還有下一款“通義”模型

 

品玩:今天很多人把大模型的突飛猛進(jìn)歸結(jié)于涌現(xiàn)(emergence)。您是否可以描述一下,通義千問的哪一個(gè)研發(fā)場(chǎng)景,讓我們覺得這個(gè)它可能它是實(shí)現(xiàn)了一次非常成功的大規(guī)模的涌現(xiàn)?

 

周靖人:我覺得涌現(xiàn)可能是一個(gè)主觀的定義。

 

品玩:不是一個(gè)科學(xué)的詞匯,是嗎?

 

周靖人:對(duì),為什么這么說,因?yàn)樗菍?duì)某一個(gè)個(gè)體認(rèn)知體系的一個(gè)沖擊,這個(gè)叫做一個(gè)涌現(xiàn)。那當(dāng)然每個(gè)人的認(rèn)知是不一樣的,所以大家看到同樣結(jié)果,也許對(duì)我是一個(gè)沖擊,對(duì)你就不是一個(gè)沖擊。

 

所以對(duì)于我們這些科技工作者來講,今天所有的科技發(fā)展都是一步步來的。所以我剛才講到,我們之所以從幾年前國(guó)內(nèi)最早就在做相關(guān)大模型的研究,如此篤定,其實(shí)我們每年都會(huì)有各種各樣的一個(gè)涌現(xiàn),我們每一份工作其實(shí)都有各種各樣的一個(gè)涌現(xiàn),當(dāng)然這一次看起來是全社會(huì)的一個(gè)涌現(xiàn),每個(gè)人都參與,但我還是認(rèn)為科技的發(fā)展總是有一定的積累后,到了一定時(shí)刻有一個(gè)突破,其實(shí)中間有很多的技術(shù)細(xì)節(jié),很多的know-how。

 

品玩:所以這些know-how是什么?很多人說現(xiàn)在找不到,跟煉丹似的,您同意這個(gè)說法嗎?

 

周靖人:我覺得應(yīng)該說今天我們有點(diǎn)類似處于早期深度學(xué)習(xí)發(fā)展的那個(gè)階段。那個(gè)時(shí)候大家對(duì)整個(gè)深度學(xué)習(xí)的理解,也覺得是“不知道為什么,反正管用”,這點(diǎn)毫無疑問。坦誠(chéng)地講,今天的進(jìn)步確實(shí)有很多工程以及經(jīng)驗(yàn)的因素在里面,這中間的的確確還有很多方面值得研究,包括這個(gè)模型深層次的機(jī)理。今天我們大概知道這個(gè)模型為什么會(huì)有這么突發(fā)的一個(gè)表現(xiàn),但真實(shí)的情況我們還是需要有一些理論的研究。

 

品玩:現(xiàn)在通義千問最希望或者最需要解決的問題是什么?

 

周靖人:這個(gè)模型可以優(yōu)化的地方還有非常多。我剛才強(qiáng)調(diào),它只是整體規(guī)劃的一個(gè)部分,讓大家體驗(yàn)到我們?cè)诠ぷ魃系囊恍┻M(jìn)展,但是離我們的整體設(shè)計(jì)還有長(zhǎng)足的工作需要去完成。

 

比如從模型本身和系統(tǒng)層來講,如何能夠更高效的去服務(wù)更大規(guī)模模型的訓(xùn)練,如何接入更多模態(tài),提高在推理側(cè)的代碼能力,提升輔助人類日常工作生活方方面面的能力,結(jié)合行業(yè)知識(shí)的定制化能力等。

 

但是解決過程也是我們科技發(fā)展的一個(gè)必經(jīng)之路,今天如果到一個(gè)時(shí)間點(diǎn)我們都覺得問題解決完了,這個(gè)領(lǐng)域也就不再令人興奮了。正因?yàn)榻裉爝@個(gè)是一個(gè)剛剛發(fā)展起來的嶄新的領(lǐng)域,我們認(rèn)為想象的空間是巨大的。

 

品玩:最后一個(gè)問題,為什么叫通義千問,一定要這么文縐縐的嗎?

 

周靖人:我們?nèi)ツ?月份的時(shí)候就發(fā)布了“通義”大模型系列,我們整體一系列的發(fā)布不是為了某一次發(fā)布而改變的策略,我們是有一個(gè)體系化的思考。今天我們發(fā)布千問是在我們既定的路線上面的一個(gè)節(jié)點(diǎn)。

 

所以通義是一個(gè)模型系列的名字,千問主要是指它目前一個(gè)主要的對(duì)話形態(tài)。千萬次的追問是人類獲取智慧的方式,我們希望千問也能夠不斷地學(xué)習(xí)逼近人類的智慧。

 

通義千問成為我們通義模型系列中重要的一員。我們接下來很快還會(huì)測(cè)試另外一款通義的模型,現(xiàn)在賣個(gè)關(guān)子。它也會(huì)叫通義什么,并且代表今天我們?cè)谙嚓P(guān)領(lǐng)域的又一個(gè)重要進(jìn)展。

 

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com