中國AI閃耀國際權威醫學評測!MentX多模態醫學推理全球第二 中國區第一
在近日公布的中國國際權威醫學多模態推理評測集MedXpertQA的MM子集榜單中,由中國企業緣啟智慧(北京)科技有限公司自主研發的閃耀醫療AI智能體MentX一舉斬獲中國區第一名,全球第二,國際國區力壓GPT-4o、權威全球GPT-5-mini等國際主流大模型,醫學醫學展現出“斷崖式”領先優勢。評測
此次MedXpertQA評測為全球公開、多第中第標準化的模態多模態醫學推理挑戰,涵蓋復雜臨床場景下的推理影像識別、病歷理解與診斷推理能力評估,中國吸引了來自中美歐多地的閃耀主流AI模型參與,被譽為“醫療AI領域的國際國區奧林匹克”。在這一國際化舞臺上,權威全球MentX不僅躋身全球前列,醫學醫學更以顯著優勢成為中國唯一進入第一梯隊的評測醫療智能體。
數據顯示,MentX在“多模態推理”(Reasoning)和“醫學理解”(Understanding)兩項核心指標上分別取得69.38分和72.36分的優異成績,綜合得分70.19%,僅次于頂尖模型GPT-5(72.18%),但大幅領先于GPT-4o(42.8%)、GPT-5-mini(60.94%)及人類預執業專家水平(45.53%),實現了對國際主流模型的全面超越。
尤為值得關注的是,排名領先的GPT-5系列模型訓練數據主要基于歐美人群的醫療記錄,相比之下,MentX從研發之初即聚焦中國臨床實踐,依托國家衛健委臨床醫學指南和醫學共識,深度融合國人的病理特征、診療習慣,在電子病歷、醫學影像與實驗室檢查等多源信息融合方面更具本土適應性。
“這意味著,MentX不僅在技術指標上趕超國際先進水平,更在臨床實用性上更懂‘中國病、中國人’。”一位業內專家向記者表示,“對于中國醫生和患者而言,一個基于本土臨床實踐、符合中國醫療流程的AI系統,其輔助診斷的準確性和可解釋性更具現實價值。”
據緣啟智慧方面介紹,MentX采用鏈式思維(Chain-of-Thought)推理架構,能夠模擬醫生循證診療過程,輸出清晰的診斷邏輯鏈,其強大的多模態融合能力可對B超、CT、MRI等影像與文本病歷進行精準解讀,甚至能準確識別患者的咳嗽聲、皮膚的照片,實現全科、多模態醫學循證,像真正的醫生一樣“望聞問切”,顯著提升臨床決策效率。
業內人士指出,MentX在國際評測中脫穎而出,標志著中國醫療AI已從“跟跑”邁向“并跑”甚至局部“領跑”階段。隨著政策支持與技術迭代加速,國產醫療AI有望在基層醫療、慢病管理、智慧醫院等場景中加速落地。
緣啟智慧表示,未來將持續優化MentX在真實世界環境中的泛化能力與安全性,推動AI全科診斷系統在全國各級醫療機構普及應用,助力“健康中國”戰略縱深推進。
(責任編輯:時尚)
- 中國創新藥崛起背后的“加減法”:為真創新提供真支持
- 戰鼓重擂 英雄輩出!996傳奇盒子超百萬獎金開啟傳奇電競雙賽爭鋒
- (粵港澳全運會)賽事看點:競走產出田徑首金 男籃上演巔峰對決
- 盧偉冰:小米手機連續三年國產銷量第一!17 Pro Max成6K+國產冠軍
- 多地醫院接診泡溫泉昏迷患者 確診熱射病
- 不止于車!曾毓群披露:寧德時代電池還下海和飛天 已獲亮眼成果
- “發現式智能”獲國際頂尖學者熱烈響應
- 高端游戲本消費需求旺盛 京東11.11銷量達成同期180%
- 中國創新藥崛起背后的“加減法”:為真創新提供真支持
- “易車榜”等被禁言!官方:從嚴整治惡意抹黑詆毀汽車企業、汽車產品
- 微盟集團:AI已成電商大促“新基建” 雙十一WAI商家使用次數提升超20%
- 華為Mate 80下周開始預熱 11月25日發布:五款機型 標配麒麟9030
- 中國在太空有“三只眼”!專家揭秘資源三號04星強大能力
- B站雙11帶貨廣告客戶數同比翻番,超千元消費品GMV同比增長63%
