騰訊混元2.0正式發布:推理能力/效率業界領先
12月6日消息,騰訊推理騰訊自研大模型混元2.0(Tencent HY 2.0)正式發布,混元同時DeepSeek V3.2也在騰訊生態內逐步接入。正式
目前,發布這兩大模型已率先在元寶、效率ima等騰訊AI原生應用中上線,業界騰訊云也已開放相關模型的領先API及平臺服務。
全新發布的騰訊推理Tencent HY 2.0,采用了混合專家(MoE)架構,混元具備高達406B總參數量(激活參數32B),正式模型支持256K超長上下文窗口,發布推理能力和效率處于業界領先地位。效率
相比上一版本(Hunyuan-T1-20250822)模型,業界HY 2.0 Think顯著改進了預訓練數據和強化學習策略,領先在數學、騰訊推理科學、代碼、指令遵循等復雜推理場景的綜合表現穩居國內第一梯隊,泛化性大幅提升。
數學科學知識推理:使用高質量數據進行Large Rollout強化學習,使得HY 2.0 Think推理能力大幅增強,在國際數學奧林匹克競賽(IMO-AnswerBench)和哈佛MIT數學競賽(HMMT2025)等權威測試中取得一流成績。結合預訓練數據的進步,模型在極度考驗知識水平的Humanity’s Last Exam(HLE)和泛化性的ARC AGI等任務上也大幅進步。
指令遵循與長文多輪能力:通過重要性采樣修正緩解了訓練和推理不一致問題,實現了長窗口RL的高效穩定訓練。同時通過多樣化可驗證的任務沙盒,以及基于打分準則的強化學習,顯著提升了HY 2.0 Think在Multi Challenge等指令遵循和多輪任務的效果。
代碼與智能體能力:構建了規模化的可驗證環境及高質量合成數據,極大增強了模型在Agentic Coding及復雜工具調用場景下的落地能力,在SWE-bench Verified及Tau2-Bench等面向真實應用場景的智能體任務上實現了躍升。
基于RLVR+RLHF雙階段的強化學習策略,HY 2.0的輸出“質感”顯著進步,在文本創作、前端開發、指令遵循等實用場景上展現了差異化優勢。
在文學創作上,HY 2.0有效減少了“AI味”,可以敏銳捕捉指令中的潛在的情感需求,輸出觀點深刻、邏輯嚴密的文章。
Tencent HY 2.0模型具備扎實的代碼能力和一定的“視覺審美”,在生成Web小游戲時,不僅能跑通復雜的JS邏輯,還能輸出審美在線的CSS布局與動畫效果。
相關文章
12月18日消息,近日,在沙特阿拉伯利雅得舉辦的BlackHat MEA CTF Final 2025圓滿落幕。由浙江大學AAA戰隊、上海交通大學0ops戰隊、復旦大學2025-12-19
Mozilla迎來新任CEO:要打造“全球最值得信賴軟件公司”
12月17日消息,Mozilla官方宣布,任命Anthony Enzor-DeMeo為新任首席執行官,接替臨時CEO Laura Chambers。Enzor-DeMeo表示,他的目標是將Mozill2025-12-19
“在一起·就可以”鴻蒙星光盛典將于2025年12月20日19:30播出,致謝每一位生態共創者與見證者,節目將在CCTV-2、CCTV-3、央視頻、央視新聞、央視財2025-12-19
四足動物在陸地進化,長期以來都在陸地上扮演著舉足輕重的生態角色,兩棲動物、爬行動物、哺乳動物、鳥類及其祖先等陸地脊椎動物都屬于四足動物。在地球歷史上,四足動物還曾多次進入海洋,并占據了食物鏈的頂端,比2025-12-19
中新社美國波特蘭12月15日電 當地時間12月15日,主場作戰的撕裂之城混音隊在美職籃(NBA)發展聯盟比賽中以116:110險勝斯托克頓國王隊。中國球員楊瀚森首發出場31分29秒,為混音隊貢獻18分2025-12-19
最近的捷尼賽思,屬實是喝涼水都塞牙。銷量本來就夠愁人,這下又整出個意想不到的瓜。它得在北美召回 483 輛 G90捷尼賽思旗艦轎車),原因是這些車會毫無征兆地自己剎車。這是什么情況?有個 G90 車主2025-12-19
