中國AI閃耀國際權威醫學評測!MentX多模態醫學推理全球第二 中國區第一
在近日公布的中國國際權威醫學多模態推理評測集MedXpertQA的MM子集榜單中,由中國企業緣啟智慧(北京)科技有限公司自主研發的閃耀醫療AI智能體MentX一舉斬獲中國區第一名,全球第二,國際國區力壓GPT-4o、權威全球GPT-5-mini等國際主流大模型,醫學醫學展現出“斷崖式”領先優勢。評測
此次MedXpertQA評測為全球公開、多第中第標準化的模態多模態醫學推理挑戰,涵蓋復雜臨床場景下的推理影像識別、病歷理解與診斷推理能力評估,中國吸引了來自中美歐多地的閃耀主流AI模型參與,被譽為“醫療AI領域的國際國區奧林匹克”。在這一國際化舞臺上,權威全球MentX不僅躋身全球前列,醫學醫學更以顯著優勢成為中國唯一進入第一梯隊的評測醫療智能體。
數據顯示,MentX在“多模態推理”(Reasoning)和“醫學理解”(Understanding)兩項核心指標上分別取得69.38分和72.36分的優異成績,綜合得分70.19%,僅次于頂尖模型GPT-5(72.18%),但大幅領先于GPT-4o(42.8%)、GPT-5-mini(60.94%)及人類預執業專家水平(45.53%),實現了對國際主流模型的全面超越。
尤為值得關注的是,排名領先的GPT-5系列模型訓練數據主要基于歐美人群的醫療記錄,相比之下,MentX從研發之初即聚焦中國臨床實踐,依托國家衛健委臨床醫學指南和醫學共識,深度融合國人的病理特征、診療習慣,在電子病歷、醫學影像與實驗室檢查等多源信息融合方面更具本土適應性。
“這意味著,MentX不僅在技術指標上趕超國際先進水平,更在臨床實用性上更懂‘中國病、中國人’。”一位業內專家向記者表示,“對于中國醫生和患者而言,一個基于本土臨床實踐、符合中國醫療流程的AI系統,其輔助診斷的準確性和可解釋性更具現實價值。”
據緣啟智慧方面介紹,MentX采用鏈式思維(Chain-of-Thought)推理架構,能夠模擬醫生循證診療過程,輸出清晰的診斷邏輯鏈,其強大的多模態融合能力可對B超、CT、MRI等影像與文本病歷進行精準解讀,甚至能準確識別患者的咳嗽聲、皮膚的照片,實現全科、多模態醫學循證,像真正的醫生一樣“望聞問切”,顯著提升臨床決策效率。
業內人士指出,MentX在國際評測中脫穎而出,標志著中國醫療AI已從“跟跑”邁向“并跑”甚至局部“領跑”階段。隨著政策支持與技術迭代加速,國產醫療AI有望在基層醫療、慢病管理、智慧醫院等場景中加速落地。
緣啟智慧表示,未來將持續優化MentX在真實世界環境中的泛化能力與安全性,推動AI全科診斷系統在全國各級醫療機構普及應用,助力“健康中國”戰略縱深推進。
相關文章
12月17日消息,近日,阿聯酋運營商du與華為簽署為期三年的戰略合作協議,并宣布完成25Gbps E-band微波鏈路的現網部署。據了解,這是E-band微波技術在5G-Advanced5.5G)站點2025-12-18
國產算力賽點:超節點長沙扎堆登場 “開放之道”與“極致之術”競逐未來
2025年11月20日,以“計算萬物,湘約未來——智算驅動新質生產力”為主題的世界計算大會在長沙啟幕。在這場匯聚了諾貝爾獎獲得者、10余位院士及數百位行2025-12-18
中新社珠海11月20日電 題:三戰全運終摘金 吳易昺:敢想敢說才能做到中新社記者 國璇6:0、1:6、6:4,歷經一場2小時3分鐘的鏖戰,20日在廣東珠海舉行的第十五屆全國運動會網球項目男子單打決賽中2025-12-18
人工智能AI)行業的爆發式增長正在對全球存儲芯片價格產生巨大沖擊,而這一影響已蔓延至顯卡市場。CNMO從《韓國經濟日報》獲悉,由于存儲芯片價格急劇上漲,AMD與英偉達兩大圖形芯片巨頭正考慮削減甚至完全2025-12-18
TapTap×MuMu模擬器合作上線 為TapTapPC版提供模擬器技術支持
近日,MuMu模擬器與游戲平臺TapTap的合作正式上線,為了給玩家們帶來更好的游戲體驗,MuMu模擬器將為TapTapPC版提供模擬器內核技術支持;本次合作將融合雙方優勢,為玩家帶來更加便捷、更加優2025-12-18
騰訊混元發布全新視頻生成模型:14G消費級顯卡流暢運行 生成5
11月21日消息,今日,騰訊混元大模型團隊宣布開源最新視頻生成模型HunyuanVideo 1.5,這是一款基于Diffusion TransformerDiT)架構、參數為8.3B的輕量級視頻生成模2025-12-18
