近日,针对罕见病“确诊难、漏诊率高”的全球性难题,上海交通大学人工智能学院与医学院附属新华医院联合团队提出了全球首个智能体式罕见病循证推理诊断系统“DeepRare”,全链路“白盒”推理刷新世界纪录。相关研究成果2月19日在线发表于《自然》杂志。
据了解,“DeepRare”打破了数据孤岛,实时链接并整合了海量医学文献知识库与真实临床病例数据。它超越了单纯的信息检索,实现了对医学知识的深度理解与内化,相当于为每一次诊断都调动了全球顶尖的医学知识储备。
带着对全球首个医学循证推理智能体的好奇,《法治周末》记者对“DeepRare”项目技术团队牵头人、上海交通大学人工智能学院教授张娅,“DeepRare”研发项目临床团队牵头人、上海交通大学医学院附属新华医院教授孙锟进行了专访。
文|《法治周末》记者 管依萌
责任编辑|王京仔
视觉编辑 | 王雪
▼全文共3518字,阅读大约需要10分钟
设计“DeepRare”的初衷是什么?
张娅:设计“DeepRare”的初衷是希望让AI去挑战一个真正的“硬骨头”。罕见病不仅是医学界的巅峰难题,其种类繁多且极其复杂,往往超越了人类医生个体的认知极限,是临床诊断中长期存在的痛点;它更是AI技术的一块“试金石”,在数据极度稀缺的“小样本”环境下实现精准逻辑推理,本身就是AI领域最前沿、也最难啃的技术骨头。选择这个方向,不仅是为了在AI的“无人区”验证技术的极端突破,更是看中了它背后极高的社会价值——我们希望用硬核科技打破罕见病患者长达数年的“诊断孤岛”,将AI的算法逻辑转化为守护生命的真实力量。
孙锟:我们做“DeepRare”,核心是直面罕见病确诊难、漏诊率高的全球性痛点,回应临床最迫切的需求。目前,罕见病病种超7000种且持续新增,患者平均确诊周期长达5年,医生一生难遇几例,传统诊疗与常规AI都难以应对。我们想打造一款可信任、可溯源、能落地的AI诊断工具,把全球罕见病知识、病例、指南高效整合,模拟资深医生的诊断思维,帮基层与专科医生快速识别罕见病,缩短患者确诊之路,让每一位罕见病患者都能被精准看见、及时诊治,这是我们作为医者必须承担的责任。
从开始研发到上线,
途中经历了哪些困难?
张娅:研发初期,最大的困难其实是来自外界的审慎和质疑。当时医院内部不少团队对AI诊断疑难杂症持观望甚至怀疑态度。我们非常庆幸并感谢我们合作的临床专家,在重重压力下选择了信任我们,这种医工交叉的底层互信,是项目得以推动的基石。
罕见病的数据不仅稀缺,而且极其零散。我们要从成千上万份逻辑混乱、格式不一的真实病历中整理出头绪,进行严苛的数据治理和逻辑对齐。这不仅是算力的较量,更是对细致程度和医学常识的极端考验。
从跑通代码到一个医生手头好用的平台,中间隔着巨大的鸿沟。为了实现复杂的工具调用、设计符合医疗直觉的交互界面,团队付出了巨大的努力。要把学术构想转化为稳定、顺滑的工业级系统,过程极其不容易。
孙锟:研发过程主要面临三大核心难题。一是决策难。罕见病无明确单一症状、分布零散,医生认知极有限,团队反复论证才下定决心攻坚这个“硬骨头”,这是最关键的一步。二是数据难。罕见病病种海量、数据碎片化、病例稀缺,完整病程数据极少,给模型训练带来极大挑战。三是信任难。传统医疗AI是“黑箱”,只给结果不讲逻辑,临床可信度低,医生不敢用,我们必须突破这一痛点。
在研发过程中,哪些事令你印象深刻?
张娅:第一,是系统表现超出了专家的预期。在系统定型后的对比实验中,原本合作的临床专家也是抱着“试一试”的心态配合我们,看看新方法到底行不行。没想到结果出来后,它在识别准确度上明显超过了部分资深专家。大家对这种跨越式的表现感到既意外又开心,因为它证明了我们选的方向在临床应用上是有真实潜力的。
第二,是投稿Nature“三天送审”。我们将这项工作整理成论文提交给《自然》后,仅用了三天时间就接到了编辑部决定送审的通知。在顶级学术期刊的审稿流程中,能在这么短的时间内通过初审并进入外审阶段,确实非常难得。这意味着这项工作的价值在第一时间就得到了国际同行专家的关注。
第三,是识别出第一例真实病例的时刻。在系统正式投入使用前,我们尝试跑了一批非常疑难的患者数据,结果它成功识别出了一位之前长期未能确诊的“小胖威利综合征”患者。当看到实验室里的研究在真实世界里完成了闭环,切实帮一个家庭找到了困扰多年的答案,团队才真正感受到了这项工作背后的社会意义。
孙锟:一是从“黑箱”到“白盒”的思维突破。我们反复讨论,决定抛弃传统AI“训练完给答案”的模式,完全遵循医生循证诊断逻辑,把每一步推理、证据来源都透明化,让医生看得懂、信得过,这一定位打破了工程团队的固有思维。
二是工程集成vs产品制造的理念转变。“DeepRare”不是简单“制造”工具,而是工程集成——整合全球病例、数据库、诊疗指南,打造可循证、可推理的智能体,像人脑一样调用知识、自主研判,而非机械匹配,这是我们最核心的亮点。
“DeepRare”的“推理过程可追溯”,
与传统医疗AI模型有什么不同?
张娅:关于这点的区别,我特别想引用一下《自然》同期配发的一篇专文评述《人工智能成功诊断罕见病》里的观点。这次,受邀的专家Timo Lassmann教授在文章里用了一个非常精准的词来形容“DeepRare”,叫“审计追踪”。这就是我们和传统医疗AI模型最大的不同。
传统的AI,哪怕是能联网检索的,往往也只是给你一个结论,然后罗列一堆参考文献链接。这就像是给了你一个答案,然后丢给你一堆书让你自己去翻,本质上它还是一个“黑盒”,因为它没告诉你它是怎么读懂这些书、怎么推导出这个结论的。
而“DeepRare”做的“可溯源”,就是那篇评论里说的“审计追踪”。它展示的是完整的解题步骤:第一步,因为症状A,我怀疑是方向B;第二步,为了验证B,我去查了文献C,发现吻合;第三步,结合基因数据D,排除了E,最终锁定了F。
正如Lassmann所评述的:这种透明的推理过程,让医生可以像审查同事的病历一样去审查AI。在医疗这种高风险决策中,只有这种看得见的“白盒”,才能真正赢得医生的信任。
如遇到没有记录的罕见病,
“DeepRare”能给出可行性建议吗?
张娅:关于“没有记录”的情况,我们需要分两种场景来看。如果是指全球范围内完全新发现、没有任何医学记载的疾病,坦率地说,这确实是一个非常大的挑战。因为在既没有历史病例参考、又缺乏相关医学知识沉淀的情况下,任何工具都很难凭空作出准确判断。但如果这种“没有记录”是指该疾病虽然尚未被正式命名或归类,但其涉及到的基因变异在生物学领域已经有了一些基础的研究成果,那么“DeepRare”还是有可能提供参考的。它可以通过分析这些已知的基因变异与临床表现之间的关联,给医生提供一些探索性的方向或排查建议。虽然这不直接等同于确诊,但能为医生在面对未知疑难杂症时提供一个逻辑支撑点。
“DeepRare”的部署成本
是否有一个大致的数字?
“DeepRare”目前已经在上海新华医院部署,一线医生对它如何评价?
张娅:相比于动辄几千上万元的基因测序或者复杂的生化检查,“DeepRare”本质上是算力成本。一旦模型部署好,它服务一万个病人和服务一个病人,边际成本是非常低的。这意味着,我们能用“软件的价格”,提供“顶级专家的服务”。这对于那些经费有限的基层医院来说,是真正能用得起的高科技。
至于医生评价,最打动我的反馈是:它不仅是一个助手,更像是一个“高水平的科研伴侣”,甚至是医生的“私人教练”。以前的AI是你问什么它答什么。但“DeepRare”会“主动给医生提建议”。比如,遇到一个疑难杂症,医生可能想到了A方向。但DeepRare会把最新的文献摆在面前,提示说:“根据最新的研究,这个症状在B疾病里也出现过,你要不要考虑一下?”
这种感觉就像是与一位博闻强记的顶尖同行在进行“思维对练”。它能帮医生从海量的文献海洋里跳出来,把精力集中在最关键的鉴别诊断上。医生用它,不仅是为了确诊这个病人,更是在和它交互的过程中,不断拓宽自己的知识边界。这种“伴随式成长”的价值,是很多医生觉得最惊艳的地方。
你希望“DeepRare”能为罕见病患者
带来哪些帮助?
张娅:最直观的愿望就是帮患者缩短那段漫长的“确诊长跑”。很多罕见病患者为了一个确诊结果,往往要奔波好几年,跑很多家医院。我希望“DeepRare”能像一个经验丰富的专家,辅助基层医生更早地识别出风险。如果能让患者在当地就得到初步的专业建议,少走一些冤枉路,少花一些不必要的费用,这就是我们做这项研究最大的价值。
孙锟:我希望“DeepRare”能成为罕见病患者的“确诊加速器”与“安全守护者”。
大幅缩短确诊时间,减少反复转诊、误诊,让患者少走弯路、减轻家庭负担。破解基层“无基因检测难确诊”的困境,仅靠表型就能高效初筛,让优质诊断能力下沉基层。提供带完整证据链的诊断,辅助医生查漏补缺,提升诊断精准度,守住诊疗安全底线,让每一位患者都得到周全评估。最终织就全球智能诊断网,让全球罕见病患者共享中国AI诊疗方案,都能被善待、被治愈。
END
【未经授权,严禁转载!联系电话028-86968276】
