Kimi最強(qiáng)開源思考模型 Kimi K2 Thinking發(fā)布:推理等超越GPT
11月7日消息,最強(qiáng)日前,開源月之暗面宣布發(fā)布Kimi K2 Thinking,思考這是模型Kimi 迄今能力最強(qiáng)的開源思考模型。
目前,布推該模型已上線kimi.com和最新版Kimi手機(jī)應(yīng)用的最強(qiáng)常規(guī)對(duì)話模式。
據(jù)了解,開源Kimi K2 Thinking原生掌握“邊思考,思考邊使用工具”的模型能力,在人類最后的布推考試(Humanity's Last Exam)、自主網(wǎng)絡(luò)瀏覽能力(BrowseComp)、最強(qiáng)復(fù)雜信息收集推理(SEAL-0)等多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到SOTA水平,開源超越GPT-5。思考
在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。
據(jù)介紹,該模型無(wú)需人類干預(yù),即可自主實(shí)現(xiàn)高達(dá)300輪的工具調(diào)用和持續(xù)穩(wěn)定的多輪思考能力,從而幫助用戶解決更復(fù)雜的問(wèn)題。
人類最后的考試是一項(xiàng)涵蓋100多個(gè)專業(yè)領(lǐng)域的終極封閉式學(xué)術(shù)測(cè)試。
在允許使用工具——搜索、Python、網(wǎng)絡(luò)瀏覽工具的同等情況下,Kimi K2 Thinking在這項(xiàng)基準(zhǔn)評(píng)測(cè)中取得了44.9%的SOTA成績(jī)。
根據(jù)官方示例顯示,Kimi K2 Thinking經(jīng)過(guò)5輪搜索和推理,結(jié)合每輪搜索到的新信息,層層深入,最終推理出了答案:
此外,在復(fù)雜搜索和瀏覽場(chǎng)景中,Kimi K2 Thinking模型也表現(xiàn)出色。
BrowseComp是由OpenAI發(fā)布的一個(gè)專門評(píng)估AI Agent網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試,這項(xiàng)測(cè)試的初衷是衡量AI Agent在信息過(guò)載環(huán)境中展現(xiàn)出的堅(jiān)持性與創(chuàng)造力,即能否像人類研究員一樣“刨根問(wèn)底”。
在這項(xiàng)極具挑戰(zhàn)的任務(wù)上,人類平均只能達(dá)到29.2%的成績(jī)。
Kimi K2 Thinking在這項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出極強(qiáng)的鉆研能力,以60.2%的成績(jī)成為新的SOTA模型。
在長(zhǎng)程規(guī)劃和自主搜索能力的驅(qū)動(dòng)下,Kimi K2 Thinking可借助多達(dá)上百輪的“思考→搜索→瀏覽網(wǎng)頁(yè)→思考→編程”動(dòng)態(tài)循環(huán),持續(xù)地提出并完善假設(shè)、驗(yàn)證證據(jù)、進(jìn)行推理,并構(gòu)建出邏輯一致的答案。
這種邊主動(dòng)搜索邊持續(xù)思考的能力,使Kimi K2 Thinking能夠?qū)⒛:议_放式的問(wèn)題分解為清晰、可執(zhí)行的子任務(wù)。
在官方示例中,Kimi K2 Thinking經(jīng)過(guò)兩輪搜索和思考,先根據(jù)股票回購(gòu)的已知信息找到了這家制造快速的公司,然后在美國(guó)證券交易委員會(huì)(SEC)的官網(wǎng)上找到了股票回購(gòu)公告信息,得出了準(zhǔn)確的答案:
相關(guān)文章:
- 什么手機(jī)可以拍實(shí)況live圖 2025Q4最推薦這款
- 海南航空比利時(shí)布魯塞爾直飛重慶航線首航
- 男子開奧迪上班 被當(dāng)成婚車頭車!拐走7臺(tái)奧迪一路跟到工廠
- 微軟Windows記事本迎重磅新功能!可原生創(chuàng)建表格
- 京東:2026“京卓越”評(píng)選升級(jí),季度動(dòng)態(tài)考核將于明年Q2上線
- 海南航空比利時(shí)布魯塞爾直飛重慶航線首航
- 廣汽豐田以“油電同強(qiáng)”破局,雙線驗(yàn)證戰(zhàn)略成功
- 甲骨文公司股價(jià)暴跌 埃里森凈資產(chǎn)縮水1300億美元
- 鴻蒙版天眼查首發(fā)上線“公司PK”功能 告別繁瑣對(duì)比 決策效率倍增
- 青春華章|科技向善 腦機(jī)接口技術(shù)點(diǎn)燃患者信心與希望
相關(guān)推薦:
- 浙江查處全國(guó)首例國(guó)際航行船舶違規(guī)使用低軌衛(wèi)星通信設(shè)備案
- 71歲董明珠現(xiàn)身直播間賣大衣 網(wǎng)友:很有氣質(zhì)就是1.5萬(wàn)太貴
- 工信部:加強(qiáng)6G與工業(yè)融合的前瞻研究
- 新舟60西南增雨機(jī)完成首飛:轉(zhuǎn)入科研試飛階段
- (尋味中華|非遺)天津“泥人張”:漕運(yùn)碼頭旁的“東方潮玩鼻祖”
- 歌手白舉綱喊話游科《黑神話》DLC趕緊上:也期待鐘馗
- 女子編造在三亞潛水被拔氧氣管 警方通報(bào):行拘5日
- 央視曝光豪車碰瓷特大騙保案:二手豪車專挑貨車撞 涉案金額超1億元
- 太瘋狂!PC廠商為何要漲價(jià)了:16G內(nèi)存條從380元漲到899元
- 海南航空比利時(shí)布魯塞爾直飛重慶航線首航
- 浙江查處全國(guó)首例國(guó)際航行船舶違規(guī)使用低軌衛(wèi)星通信設(shè)備案
- 微軟Windows 11默認(rèn)啟用新功能!低配置電腦扛不住了
- 大鵬談被搜狐張朝陽(yáng)辭退:對(duì)電影播放有分歧 然后就收到離職通知 沒有補(bǔ)償金
- 魏建軍耿直反共識(shí) 長(zhǎng)城后面還要推出“防忽悠指南”
- 2025最強(qiáng)拍照手機(jī)推薦 榮耀500系列影像解析
- NVIDIA計(jì)劃減產(chǎn)RTX 50系列!供應(yīng)銳減40%
- 魏建軍耿直反共識(shí) 長(zhǎng)城后面還要推出“防忽悠指南”
- 寧夏構(gòu)建耕地?cái)?shù)量質(zhì)量生態(tài)“三位一體”保護(hù)新格局
- 兩男子路怒后斗氣追逐穿插別車:危險(xiǎn)駕駛 雙雙獲刑
- 小米、鴻蒙智行、理想相繼報(bào)警 12人被抓!理想回應(yīng)被水軍抹黑
