計(jì)算成本太高或壓垮科技巨頭,移動(dòng)設(shè)備成AIGC新賽道
生成式人工智能模型正以創(chuàng)作文本、圖像甚至視頻的能力吸引用戶,但生成這些內(nèi)容所需的計(jì)算資源相當(dāng)龐大,因此它們目前只能在云端或高性能計(jì)算機(jī)上運(yùn)行。不過,將爆火聊天機(jī)器人ChatGPT背后的技術(shù)帶到移動(dòng)設(shè)備上的競(jìng)賽已經(jīng)開始。從這項(xiàng)技術(shù)驚人的發(fā)展速度來看,它可能會(huì)以超出人們想象的速度改變移動(dòng)通信和計(jì)算領(lǐng)域。
利用手機(jī)上冗余的處理能力分擔(dān)成本
隨著科技公司急于將生成式人工智能嵌入其軟件和服務(wù)中,它們面臨著計(jì)算成本大幅上升的問題。這種擔(dān)憂對(duì)谷歌的影響尤其大,華爾街分析師警告稱,如果互聯(lián)網(wǎng)搜索用戶開始期望在標(biāo)準(zhǔn)搜索結(jié)果中出現(xiàn)人工智能生成的內(nèi)容,谷歌的利潤率可能會(huì)受到擠壓。
在移動(dòng)設(shè)備上運(yùn)行生成式人工智能,而不是通過大型科技公司運(yùn)營的服務(wù)器上的云計(jì)算系統(tǒng),有望解決最新人工智能技術(shù)潮流中一個(gè)最大的成本問題。
谷歌上周表示,該公司已經(jīng)成功在三星Galaxy手機(jī)上運(yùn)行了其最新大語言模型PaLM 2。盡管該公司沒有公開展示這種被稱為Gecko的縮小模型,但此舉堪稱是一個(gè)最新跡象,表明一種只需要數(shù)據(jù)中心計(jì)算資源支持的人工智能正迅速開始進(jìn)入更多地方。
這一轉(zhuǎn)變可能會(huì)使聊天機(jī)器人等服務(wù)的運(yùn)行成本大大降低,并為使用生成性人工智能的更具變革性的應(yīng)用程序鋪平道路。
移動(dòng)芯片公司高通首席執(zhí)行官克里斯蒂亞諾·阿蒙(Cristiano Amon)表示:“你需要開發(fā)人工智能混合技術(shù),讓它能同時(shí)在數(shù)據(jù)中心和本地運(yùn)行,否則成本太高?!彼a(bǔ)充說,利用手機(jī)上未使用的處理能力是分擔(dān)成本的最佳方式。
小模型爆發(fā)式增長拉近愿景
去年年底,當(dāng)ChatGPT的推出引起了人們對(duì)生成式人工智能的廣泛關(guān)注時(shí),將其帶到移動(dòng)設(shè)備上的愿景似乎還很遙遠(yuǎn)。除了對(duì)這類服務(wù)背后的所謂大語言模型進(jìn)行培訓(xùn)外,推理(或運(yùn)行模型以產(chǎn)生結(jié)果)的工作也需要計(jì)算。手機(jī)缺乏足夠的內(nèi)存來容納像ChatGPT這樣的大型模型,也缺乏運(yùn)行這些模型所需的處理能力。
在移動(dòng)設(shè)備上生成對(duì)查詢的響應(yīng),而不是等待遠(yuǎn)程數(shù)據(jù)中心產(chǎn)生結(jié)果,可以減少使用應(yīng)用程序的延遲。當(dāng)用戶的個(gè)人數(shù)據(jù)被用來提煉生成性反應(yīng)時(shí),將所有處理過程保留在手機(jī)上也可以增強(qiáng)隱私保護(hù)。
最重要的是,生成性人工智能可以讓在智能手機(jī)上進(jìn)行的常見活動(dòng)變得更容易,例如涉及到生成文本的事宜。阿蒙解釋稱:“你可以將人工智能嵌入到每個(gè)辦公應(yīng)用程序中:你會(huì)收到一封電子郵件,它會(huì)建議你做出回應(yīng),但你將需要在本地和數(shù)據(jù)中心運(yùn)行這些東西的能力。”
有些基礎(chǔ)模型的快速發(fā)展已經(jīng)改變了這一平衡。最大和最先進(jìn)的模型總是占據(jù)頭條的位置,如谷歌的PaLM 2和OpenAI的GPT-4。但隨著較小模型的爆炸式增長,有些同樣的功能可以以技術(shù)要求較低的方式獲得。它們部分受益于新技術(shù),這些技術(shù)基于對(duì)語言模型進(jìn)行更仔細(xì)的培訓(xùn)來微調(diào),從而減少了語言模型需要保存的信息量。
IBM首席執(zhí)行官阿爾溫德·克里希納(Arvind Krishna)表示,大多數(shù)希望在自己的服務(wù)中使用生成式人工智能的公司,將通過組合許多這樣的小型模型來滿足自己的需求。上周,IBM宣布推出專門的技術(shù)平臺(tái),以幫助其客戶利用生成式人工智能。克里希納稱,許多公司會(huì)選擇使用開源模型。這種模型的代碼更透明,同時(shí)使用他們自己的數(shù)據(jù)對(duì)技術(shù)進(jìn)行微調(diào)會(huì)更容易。
有些較小的模型已經(jīng)展示了令人驚訝的能力,其中包括由Facebook母公司Meta發(fā)布的開源語言模型LLaMa,據(jù)稱它與大型系統(tǒng)的許多功能相媲美。
LLaMa有各種各樣的規(guī)模,其中最小的只有70億個(gè)參數(shù),遠(yuǎn)遠(yuǎn)少于OpenAI在2020年發(fā)布的突破性語言模型GPT-3的1750億個(gè)參數(shù),更不用說今年發(fā)布的GPT-4,后者的參數(shù)數(shù)量尚未披露。斯坦福大學(xué)基于LLaMa開發(fā)的研究模型已經(jīng)在谷歌的Pixel 6手機(jī)上運(yùn)行。
除了規(guī)模更小外,這類模型的開源特性也使研究人員和開發(fā)人員更容易適應(yīng)不同的計(jì)算環(huán)境。高通今年早些時(shí)候展示了據(jù)稱是首款運(yùn)行Stable Diffusion圖像生成模型的安卓手機(jī),該模型擁有約10億個(gè)參數(shù)。高通高級(jí)副總裁齊亞德·阿斯加爾(Ziad Asghar)表示,這家芯片制造商“量化”了這款模型,即縮小了它的尺寸,以便更容易在手機(jī)上運(yùn)行,同時(shí)又不會(huì)失去任何準(zhǔn)確性。
平臺(tái)轉(zhuǎn)移將為蘋果帶來機(jī)會(huì)?
Creative Strategies的分析師本·巴加林(Ben Bajarin)說,由于針對(duì)手機(jī)定制的大部分功能仍處于試驗(yàn)階段,現(xiàn)在評(píng)估這些努力是否會(huì)帶來真正有用的移動(dòng)應(yīng)用還為時(shí)過早。他預(yù)測(cè),從第一波擁有10億至100億個(gè)參數(shù)的移動(dòng)模型中,會(huì)出現(xiàn)相對(duì)初級(jí)的應(yīng)用程序,比如語音控制的照片編輯功能和簡(jiǎn)單的問答功能。
谷歌旗下人工智能研究部門DeepMind副總裁佐賓·加赫拉馬尼(Zoubin Ghahramani)表示,其Gecko移動(dòng)模型每秒可以處理16個(gè)令牌。令牌是大型語言模型處理的短文本單位數(shù)量。大多數(shù)大型模型每生成一個(gè)單詞使用1-2個(gè)令牌,這表明Gecko在手機(jī)上每秒可以生成10-15個(gè)單詞,這可能使它適合于提示短信或簡(jiǎn)短的電子郵件回復(fù)。
高通的阿斯加爾表示,移動(dòng)手機(jī)的特殊要求意味著,人們的注意力可能會(huì)迅速轉(zhuǎn)向所謂的多模態(tài)模型,這種模型可以處理一系列圖像、文本和其他輸入。他補(bǔ)充說,移動(dòng)應(yīng)用程序可能會(huì)非常依賴語音和圖像,而不是個(gè)人電腦上更常見的大量文本應(yīng)用程序。
與此同時(shí),生成式人工智能開始以驚人的速度向智能手機(jī)等移動(dòng)平臺(tái)上轉(zhuǎn)移,這將增加人們對(duì)蘋果的關(guān)注。盡管迄今為止,蘋果始終沒有就這波人工智能浪潮做出動(dòng)作。
巴加林說,生成式人工智能存在眾所周知的缺陷,比如大型模型容易產(chǎn)生“幻覺”,或者聊天機(jī)器人會(huì)用捏造的信息做出反應(yīng)。這意味著,蘋果在一段時(shí)間內(nèi)不太可能將這項(xiàng)技術(shù)嵌入iPhone的操作系統(tǒng)中。相反,他預(yù)測(cè)該公司將尋找方法,讓應(yīng)用開發(fā)者更容易在自己的服務(wù)中測(cè)試這項(xiàng)技術(shù)。
巴加林表示:“這也是微軟和谷歌的態(tài)度:他們都希望為開發(fā)者提供工具,讓他們能夠與生成式人工智能應(yīng)用競(jìng)爭(zhēng)?!?/span>
蘋果的全球開發(fā)者大會(huì)將于6月5日召開,在此之前,微軟也將舉行名為Build的開發(fā)者大會(huì),爭(zhēng)奪開發(fā)者注意力的斗爭(zhēng)將變得更加激烈。生成式人工智能可能仍處于起步階段,但進(jìn)入更多用戶移動(dòng)設(shè)備的賽道已經(jīng)啟動(dòng)超速行駛狀態(tài)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

