騰訊混元2.0重磅發(fā)布:推理性能與效率躋身業(yè)界前列
快科技12月6日消息,騰訊自主研發(fā)的大模型混元2.0(Tencent HY 2.0)正式亮相,與此同時(shí),DeepSeek V3.2也正逐步融入騰訊生態(tài)體系。
目前,這兩大模型已率先在元寶、ima等騰訊AI原生應(yīng)用中上線運(yùn)行,騰訊云也已開放相關(guān)模型的API接口及平臺(tái)服務(wù)。
全新推出的Tencent HY 2.0采用混合專家(MoE)架構(gòu),總參數(shù)量高達(dá)4060億(激活參數(shù)320億),支持256K超長(zhǎng)上下文窗口,推理能力與效率處于業(yè)界領(lǐng)先水平。

相較于上一版本(Hunyuan-T1-20250822),HY 2.0 Think在預(yù)訓(xùn)練數(shù)據(jù)和強(qiáng)化學(xué)習(xí)策略上均有顯著優(yōu)化,在數(shù)學(xué)、科學(xué)、代碼、指令遵循等復(fù)雜推理場(chǎng)景的綜合表現(xiàn)穩(wěn)居國內(nèi)第一梯隊(duì),泛化能力大幅提升。
數(shù)學(xué)科學(xué)知識(shí)推理方面:通過高質(zhì)量數(shù)據(jù)開展Large Rollout強(qiáng)化學(xué)習(xí),使HY 2.0 Think的推理能力顯著增強(qiáng),在國際數(shù)學(xué)奧林匹克競(jìng)賽(IMO-AnswerBench)和哈佛MIT數(shù)學(xué)競(jìng)賽(HMMT2025)等權(quán)威測(cè)試中取得優(yōu)異成績(jī)。依托預(yù)訓(xùn)練數(shù)據(jù)的改進(jìn),模型在極度考驗(yàn)知識(shí)儲(chǔ)備的Humanity’s Last Exam(HLE)和側(cè)重泛化性的ARC AGI等任務(wù)中也實(shí)現(xiàn)了大幅進(jìn)步。

指令遵循與長(zhǎng)文多輪交互能力:借助重要性采樣修正緩解訓(xùn)練與推理的不一致問題,實(shí)現(xiàn)長(zhǎng)窗口RL的高效穩(wěn)定訓(xùn)練。同時(shí),通過多樣化可驗(yàn)證的任務(wù)沙盒及基于打分準(zhǔn)則的強(qiáng)化學(xué)習(xí),顯著提升了HY 2.0 Think在Multi Challenge等指令遵循和多輪任務(wù)中的表現(xiàn)。
代碼與智能體能力:構(gòu)建規(guī)模化可驗(yàn)證環(huán)境及高質(zhì)量合成數(shù)據(jù),極大增強(qiáng)了模型在Agentic Coding及復(fù)雜工具調(diào)用場(chǎng)景下的落地能力,在SWE-bench Verified及Tau2-Bench等面向真實(shí)應(yīng)用場(chǎng)景的智能體任務(wù)中實(shí)現(xiàn)了性能躍升。

基于RLVR+RLHF雙階段強(qiáng)化學(xué)習(xí)策略,HY 2.0的輸出“質(zhì)感”明顯提升,在文本創(chuàng)作、前端開發(fā)、指令遵循等實(shí)用場(chǎng)景中展現(xiàn)出差異化優(yōu)勢(shì)。
在文學(xué)創(chuàng)作領(lǐng)域,HY 2.0有效降低了“AI痕跡”,能夠敏銳捕捉指令中的潛在情感需求,輸出觀點(diǎn)深刻、邏輯嚴(yán)謹(jǐn)?shù)奈恼隆?/p>
Tencent HY 2.0模型具備扎實(shí)的代碼能力和一定的“視覺審美”,在生成Web小游戲時(shí),不僅能順暢運(yùn)行復(fù)雜的JS邏輯,還能輸出符合審美標(biāo)準(zhǔn)的CSS布局與動(dòng)畫效果。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



