馬斯克慌了,一文梳理GPT-4與3.5區(qū)別
ChatGPT公司OpenAI隔夜上線了其最新人工智能模型GPT-4,轟動(dòng)了整個(gè)科技界。據(jù)OpenAI自己稱,GPT-4將是該公司里程碑式的模型。
在其概念視頻中,OpenAI介紹新模型可以解決更復(fù)雜的問題、編寫更大型的代碼,并通過圖片產(chǎn)生文字。此外,OpenAI還承諾GPT-4相比之前的模型,包括ChatGPT此前應(yīng)用的GPT-3.5,將更加安全且具協(xié)調(diào)性。
用簡單的話說,GPT-4模型改變了此前ChatGPT等歷史人工智能的單一、文本短小等缺點(diǎn),變身為一個(gè)能看圖說話的高級(jí)“解語花”。
然而,這朵“解語花”也點(diǎn)燃了不少人的焦慮,比如硅谷最著名的企業(yè)家馬斯克。
他在推特平臺(tái)上發(fā)文稱:人類還能做什么?我們最好使用Neuralink(來對抗人工智能)!

此外,他還回復(fù)了網(wǎng)友關(guān)于GPT-4內(nèi)測的帖子,稱他個(gè)人十分關(guān)切這個(gè)新模型,也認(rèn)為這個(gè)新的人工智能看起來很有意思。
但馬斯克關(guān)于GPT-4和Neuralink的評論還是讓不少網(wǎng)友覺得尷尬,不少人嘲諷他的腦機(jī)廣告聽起來并不吸引人。相比于人工智能機(jī)器人取代人類,在大腦里植入設(shè)備似乎更讓人頭皮發(fā)麻。
不過,網(wǎng)友們關(guān)于GPT-4領(lǐng)導(dǎo)機(jī)器人占領(lǐng)世界的想法也是過于杞人憂天。
正如OpenAI強(qiáng)調(diào)的那樣,GPT-4目前仍是并不完美的模型,其能力遠(yuǎn)不如人類。GPT-4仍有許多局限性,如社會(huì)偏見、幻覺和對抗性提示。
硅谷做題家
GPT-4現(xiàn)在最熱門的話題莫過于它強(qiáng)大的應(yīng)試能力。根據(jù)OpenAI的評估,GPT-4已經(jīng)能輕松通過美國的律師考試,且考進(jìn)了前10%的排名。相比之下,它的上一代模型GPT-3.5只能吊個(gè)車尾。
除了律師考試,GPT-4還在美國大學(xué)入學(xué)測試SAT中考到710分,雖然分?jǐn)?shù)不高,但已經(jīng)夠上美國大學(xué)錄取水平。更重要的是,GPT-4能在大學(xué)的基礎(chǔ)微積分課程中獲得4的成績(5分為滿分),這證明了該模型已經(jīng)掌握了高等數(shù)學(xué)大部分的概念。
網(wǎng)友也對它的這些做題能力進(jìn)行了進(jìn)一步的測試。
比如讓它分析柱狀圖,并回答圖形背后的統(tǒng)計(jì)學(xué)意義,或者出一道用法語描述的物理題。令人欣慰的是,它竟然沒有胡言亂語,而是有條有理地給出了正確答案。


另一方面,已經(jīng)升級(jí)為GPT-4模型的ChatGPT,現(xiàn)在已經(jīng)可以通過用戶的簡單需求直接生成代碼,甚至網(wǎng)站。即便用戶只是在餐巾紙上畫了個(gè)簡單界面,GPT-4都能直接搞出一個(gè)可運(yùn)行的網(wǎng)站。

如此好用不廢話的程序員,大概是每一個(gè)產(chǎn)品經(jīng)理心中永遠(yuǎn)的神。
量子波動(dòng)速讀?
更讓人嫉妒的是,曾經(jīng)中國爆火的“量子波動(dòng)速讀”竟然也在GPT-4上獲得了重現(xiàn)。這種被機(jī)構(gòu)濫用的反人類教育噱頭,在非人類的人工智能上卻得到了完美的詮釋。
有網(wǎng)友將一整篇論文上傳給GPT-4,然后,GPT-4就在極短時(shí)間內(nèi)完成了閱讀,并給出清晰的總結(jié)摘要。


甚至,如果有人問它某個(gè)圖是什么意思,代表了什么意義,GPT-4也能像模像樣地給出解答。

與GPT-3.5相比,GPT-4將文字輸入限制提升至2.5萬字,這讓其閱讀體量大大增加,也讓用戶的文書處理工作變得更加簡潔。
此外,強(qiáng)大的識(shí)圖能力和顯著提高的回答準(zhǔn)確性,也保證了GPT-4在文字處理上的優(yōu)越性,相較于GPT-3.5的答不上來就亂編,已經(jīng)出現(xiàn)了長足的進(jìn)步。
破解冷笑話
如果說昨天的ChatGPT還是一個(gè)不解人意的“老古董”,那么今天的ChatGPT就已經(jīng)可以輕松理解網(wǎng)友心照不宣的冷笑話,即便是表情包,它也能說個(gè)子丑寅卯來。
比如雞米花拼成的世界地圖,ChatGPT就輕松回答出了網(wǎng)友想要的答案:這是個(gè)玩笑,用雞米花和世界地圖兩個(gè)不相干的東西形成一種幽默。

雖然識(shí)圖這一功能在人工智能領(lǐng)域并不罕見,谷歌搜索甚至連淘寶都具備識(shí)圖功能,但這一功能還是首次亮相于ChatGPT。
而除了簡單的識(shí)圖之外,更可貴的是,ChatGPT現(xiàn)在還能解釋圖像的具體意義,并理解圖像背后的隱喻含義,這在其他識(shí)圖人工智能上仍十分罕見。
可惜的是,目前圖像輸入的功能仍只是預(yù)覽階段,還不能使用,即便是氪金玩家現(xiàn)在也只能按捺住好奇心。
Cosplay“受害者”
早在ChatGPT出來的時(shí)候,網(wǎng)友們就熱衷于讓人工智能玩角色扮演的游戲。什么假設(shè)你是一個(gè)財(cái)經(jīng)編輯啦,假設(shè)你是一個(gè)程序員啦,假設(shè)你是小說家啦……總之,網(wǎng)友想到什么,ChatGPT就被迫成為什么。
而現(xiàn)在,這樣的花活居然被OpenAI官方帶頭認(rèn)可。
相比于GPT-3.5時(shí)期,現(xiàn)在鳥槍換炮的ChatGPT不再用一本正經(jīng)的語氣規(guī)勸網(wǎng)友,類似于“我只是個(gè)人工智能,我無法……”的表達(dá),現(xiàn)在都用更具個(gè)性化的話替代。

OpenAI要求GPT-4拿出服務(wù)精神。既然用戶希望得到一個(gè)定制的GPT-4,那么GPT-4就要表現(xiàn)出相應(yīng)的人物性格和態(tài)度。
缺憾仍在
根據(jù)OpenAI的內(nèi)部測試,GPT-4仍有GPT-3.5的老毛病,就是胡言亂語。專業(yè)地講,GPT-4仍會(huì)產(chǎn)生幻覺,生產(chǎn)錯(cuò)誤答案,并出現(xiàn)推理錯(cuò)誤。
總的來說,GPT-4已經(jīng)顯著減輕了幻覺問題,在這一項(xiàng)上,GPT-4的分?jǐn)?shù)比GPT-3.5要高出40%。但這可能也意味著GPT-4的亂講話可能更隱蔽,更難以被用戶察覺。
另一方面,GPT-4仍缺乏對數(shù)據(jù)截至日期后新進(jìn)展的了解能力,即其無法在訓(xùn)練學(xué)習(xí)后,追蹤新的信息來補(bǔ)足對某件事認(rèn)知。此外,它也無法從經(jīng)驗(yàn)中學(xué)習(xí),并可能一直輕信人類。
在安全邊界上面,GPT-4也得到了相應(yīng)的加強(qiáng),與GPT-3.5相比,它對違禁內(nèi)容的回復(fù)率下降了82%,對敏感內(nèi)容(如醫(yī)療建議)的響應(yīng)率則提高了29%。
還有一個(gè)不太友好的地方在于,GPT-4的使用目前僅對ChatGPT Plus玩家開放,換句話說,需要付費(fèi)。
目前OpenAI對GPT-4的訓(xùn)練規(guī)模、硬件、算力等一切保持緘默,只說會(huì)在未來陸續(xù)公布,可謂是吊足了外部觀眾的胃口。
不過,瑕不掩瑜,截至目前,科技人士對GPT-4的評估仍持正面態(tài)度。更多的人則在說:未來已來,迎接新世界吧。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

