本報訊 (記者矯月)5月27日,國內權威醫療大模型評測平臺MedBench發布最新評測榜單。深蘭科技DeepBlue-MR-v1醫療大模型不僅以復雜醫學推理評測第一的成績持續霸榜,而且在多個綜合評測中以94.2的高分榮膺桂冠。
榜單顯示,參與本次評測的大模型有騰訊優圖天衍醫學大模型、基于華為盤古大模型研發的潤醫醫療大模型、云知聲UniGPT-Med-U1大模型等。
MedBench是中文醫療大模型第一權威評測平臺,由上海人工智能實驗室與上海市數字醫學創新中心聯合國內多家醫療機構和科研單位設立,該平臺匯聚了頂級醫療機構的專家經驗和知識儲備,已為全球超過387個模型提供評測。
深蘭科技DeepBlue-MR-v1醫學推理大模型是由深蘭科技自主研發的醫學推理大模型,擅長臨床醫學問診、輔助醫學診斷和制定診療方案等任務,通過對醫學教科書、診療指南、專家論文、病案病歷、醫學推理、醫學術語以及心理咨詢等海量數據的清洗、構建和醫學專家團隊標注,運用自研訓練體系,實現了人類醫學推理能力對齊的基于Transformer架構的稠密大語言模型。DeepBlue-MR-v1醫學推理大模型在海量高質量的醫學數據上進行預訓練,構建醫學推理語義空間,通過訓練監督微調、醫學推理指令增強和多階段自適應強化學習算法實現醫學推理能力迭代提高。
醫學推理能力是AI醫療皇冠上的明珠。深蘭科技DeepBlue-MR-v1醫療大模型,自登頂MedBench復雜醫學推理能力榜首至今,持續霸榜并擴大領先優勢。在保持復雜醫學推理能力的絕對領先優勢的同時,還在醫學語言理解、醫學語言生成、醫學知識問答、復雜醫學推理、醫療安全和倫理共五個維度的綜合得分也榮登MedBench榜首,該成績充分彰顯了公司行業領先的技術實力。
目前,基于DeepBlue-MR-v1醫療大模型,深蘭科技所開發的AI醫療產品,已形成涵蓋“AI問診助手”“遠程視頻問診”“輔助診斷系統”及“醫學專家知識庫”等在內的智能體產品矩陣。與武漢市中心醫院、武漢協和醫院、武漢市血液中心、武漢市精衛中心、武漢市武東醫院等多家醫療機構達成合作,將聯手推動AI技術在問診、診斷、專科服務等場景的深度應用。
(編輯 張昕)
23:28 | 電池級碳酸鋰價格持續下探 產業競... |
23:28 | 千金藥業:積蓄創新動能 做大做強... |
23:28 | 水泥上市公司多線突圍 2025年行業... |
23:28 | 鎢價站上歷史高位 供求緊平衡格局... |
23:28 | 直擊山西汾酒年度股東大會:以實力... |
23:28 | 5月份電影總票房突破15億元 已有52... |
23:28 | 分紅又“送禮” 上市公司回饋股東... |
23:28 | 切斷“零公里二手車”灰色利益鏈 ... |
23:28 | 多地機票價格顯著回落 錯峰游受青... |
23:28 | 文化破壁、標準建立、供應鏈先行 ... |
23:28 | 年內險資資產支持計劃登記規模同比... |
23:28 | 緩解凈息差壓力 多家民營銀行跟進... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注