Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
高龄患者在ICU中的预后评估至关重要,但机器学习模型在不同医疗中心的表现往往存在显著差异。最近的多中心研究通过12个国际医学中心对ELDER-ICU模型进行了验证,并系统性地评估了模型更新策略,为临床AI工具的跨区域推广提供了重要证据。
预测高龄危重患者的住院死亡率对于治疗决策和资源分配至关重要。机器学习模型在这一领域展现了潜力,但现实中存在一个普遍的挑战:在某个医疗中心开发的模型往往在其他医疗中心的表现不如预期。这种”性能衰减”问题源于不同医疗中心患者群体的差异、诊疗流程的不同以及数据采集标准的差异。
ELDER-ICU是一个专为老年ICU患者(≥65岁)开发的机器学习模型,旨在预测住院死亡率。然而,开发模型容易,让模型在全球范围内的多个医疗中心可靠运行则更为复杂。这项研究的核心问题是:ELDER-ICU模型在国际范围内是否保持一致的性能?当模型性能下降时,我们应该如何调整模型以适应本地患者群体?
这项研究的核心发现是:机器学习模型的跨中心转移不是简单的”拿来即用”问题,而需要系统化的验证和有针对性的调整策略。不同的患者群体和医疗环境需要不同的应对方案。
对于与模型开发队列相似的医疗中心(如美国和欧洲中心),简单的重新标定可能已足够;对于存在中等程度差异的医疗中心,增量训练提供了一种平衡的解决方案——它保留了原始模型的大部分特性,同时允许对本地数据的适应;而对于患者特征和临床管理显著不同的医疗中心(如本研究中的亚洲中心),完全重训练可能才能达到最优性能。
这一发现对中国医疗机构特别重要。作为病例量较大但临床特征可能与西方患者群体不同的地区,中国医疗中心在采纳国际AI模型时,不应盲目依赖已发表的性能指标,而应进行本地验证并考虑根据实际患者群体进行适应性调整。研究还表明,在模型部署前应进行”缺口分析”,以评估本地患者群体与模型开发队列之间的差异程度,从而选择最合适的更新策略。
虽然这项研究涉及12个国际医学中心,但仍存在一些需要注意的局限。首先,研究采用了回顾性设计,这意味着数据采集方式和完整性可能因医疗中心而异。其次,虽然使用了多个公开数据库,但不同数据库的临床变量和数据质量存在差异,这可能影响比较结果的可靠性。第三,模型更新策略的最优选择可能因医疗中心的具体情况而异,本研究提供的是基于汇总分析的建议,而非个性化指导。
此外,虽然研究强调了患者特征分布转移的重要性,但对于如何预测哪种更新策略最适合某个特定医疗中心,研究的指导仍有限。未来的工作应该开发更精准的预测工具,帮助医疗中心在模型部署前就能判断最优的适应策略。
Original paper: Multicenter validation and updating of the ELDER-ICU model for severity assessment in elderly critical illness. — NPJ digital medicine. 10.1038/s41746-026-02472-1