OpenAI推出GPT-5.2:錯(cuò)誤率降低30% 專業(yè)任務(wù)表現(xiàn)超越人類專家
【CNMO科技消息】12月12日,據(jù)外媒報(bào)道,在GPT-5.1發(fā)布僅一個(gè)月后,OpenAI今日正式推出新一代模型系列GPT-5.2,該系列將為其熱門聊天機(jī)器人提供技術(shù)支持。官方表示,GPT-5.2是目前“針對(duì)專業(yè)知識(shí)工作領(lǐng)域最強(qiáng)大的模型系列”。

GPT-5.2的設(shè)計(jì)目標(biāo)是幫助用戶更高效地完成各類工作。它在創(chuàng)建電子表格、制作演示文稿、編寫代碼、圖像識(shí)別、長文本理解、工具調(diào)用以及多步驟項(xiàng)目執(zhí)行等方面的表現(xiàn)均有提升。新模型在通用智能、長上下文處理、智能體工具調(diào)用和視覺能力上都進(jìn)行了優(yōu)化,十分適合實(shí)際工作中的專業(yè)應(yīng)用場(chǎng)景。
具體來看,GPT-5.2的“思考”版本相比GPT-5.1的同版本,生成的錯(cuò)誤內(nèi)容更少,含錯(cuò)回復(fù)比例降低了30%。其長上下文處理能力大幅增強(qiáng),能夠應(yīng)對(duì)報(bào)告、合同、論文及多文件項(xiàng)目等內(nèi)容,在數(shù)十萬tokens的文本范圍內(nèi)仍能保持信息準(zhǔn)確性。同時(shí),它在解析截圖、技術(shù)圖表和可視化報(bào)告方面也更為精準(zhǔn)。
OpenAI透露,在覆蓋44種職業(yè)的知識(shí)工作任務(wù)測(cè)試中,GPT-5.2的表現(xiàn)超過了行業(yè)專業(yè)人士,在GDPval測(cè)試中獲得70.9%的分?jǐn)?shù)。相比之下,GPT-5.1在該基準(zhǔn)測(cè)試中的得分僅為38.8%。這讓GPT-5.2成為OpenAI首個(gè)達(dá)到或超越人類專家水平的模型。
對(duì)于ChatGPT用戶而言,GPT-5.2會(huì)顯得更有條理、更可靠,且語調(diào)更親切、更具對(duì)話感。OpenAI介紹,GPT-5.2 Instant是日常工作的實(shí)用助手,在信息搜索、步驟指引、技術(shù)寫作和翻譯方面有所改進(jìn);GPT-5.2 Thinking適用于更復(fù)雜的任務(wù),如長文檔總結(jié)、編程、解答上傳文件相關(guān)問題及決策規(guī)劃;而GPT-5.2 Pro則專為需要高質(zhì)量答案的難題設(shè)計(jì),值得用戶等待。
GPT-5.2的Instant、Thinking和Pro版本從即日起向付費(fèi)ChatGPT用戶開放,其API也將對(duì)所有開發(fā)者開放使用。
此次新一代模型的發(fā)布,距離OpenAI首席執(zhí)行官山姆·奧特曼宣布“代碼紅色”狀態(tài)僅一周時(shí)間。他當(dāng)時(shí)要求員工集中精力改進(jìn)ChatGPT,以確保其不會(huì)落后于谷歌Gemini、Anthropic Claude等競(jìng)爭(zhēng)對(duì)手。GPT-5.2的快速推出,無疑體現(xiàn)了OpenAI在激烈的AI競(jìng)爭(zhēng)中保持領(lǐng)先地位的決心。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




