Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
一项发表在《Nature Biomedical Engineering》上的研究介绍了BUSGen,首个针对乳腺超声图像分析的基础生成模型。该模型在早期乳腺癌诊断中的表现超越了全部9名认证放射科医生,灵敏度平均提高16.5%。
乳腺癌是全球女性最常见的癌症之一,早期诊断对改善患者预后至关重要。乳腺超声因其无放射线辐射、成本低、易于获取等优势,已成为乳腺癌筛查的重要工具。然而,超声诊断高度依赖医生的经验和技能,诊断结果存在显著的医生间差异。同时,医学影像数据的隐私敏感性和数据获取困难,也制约了人工智能模型在这一领域的发展。
为解决这些问题,研究团队开发了BUSGen——一个基于扩散模型的基础生成模型。与传统的只能进行单一任务(如良恶性分类)的AI模型不同,基础生成模型能够学习医学影像的底层特征,并通过少量样本快速适应多种临床任务。这种方法不仅有望提升诊断准确率,还能生成逼真的合成医学影像,为隐私保护提供新途径。
研究团队利用350万例乳腺超声图像对BUSGen进行预训练。这个庞大的数据集使模型能够全面学习乳腺的正常结构、病理特征和临床变异表现。模型采用了基于U-Net架构的扩散神经网络,并通过LoRA微调技术实现了高效的少样本适应。
研究通过两个主要途径评估了BUSGen的性能:一是在下游分类任务中与其他AI方法比较;二是进行临床阅片研究,直接比较AI诊断性能与9名董事会认证放射科医生的诊断结果。此外,研究还评估了合成数据的生成质量,以及合成数据对模型泛化能力的影响。
BUSGen的出现具有重要的临床和科学意义。首先,在诊断性能方面,该模型超越人类放射科医生的表现表明,AI辅助诊断有潜力显著提升乳腺癌的检出率,特别是早期病变的发现。这对降低乳腺癌死亡率、改善患者预后具有重要意义。
其次,BUSGen的合成数据生成能力为医学AI发展中的关键难题——数据隐私保护提供了创新解决方案。医学影像数据涉及患者隐私,获取和共享受到严格限制,这往往成为多机构合作研究的瓶颈。BUSGen生成的合成影像既保留了临床诊断的关键信息,又不含真实患者隐私数据。这使得医学AI模型可以在尊重患者隐私的前提下进行更广泛的开发和验证。
此外,该基础模型的泛化能力强,能够通过少量样本快速适应各种乳腺超声分析任务。这意味着同一个基础模型可以支持良恶性分类、病灶类型识别、风险评估等多项临床应用,提高了医学AI开发的效率。对于医疗资源相对不足的地区和机构,这种方法可以帮助提升乳腺癌诊断的标准化和可及性。
尽管BUSGen取得了令人瞩目的成绩,但研究也存在若干局限。首先,该研究主要基于计算方法的评估。虽然进行了临床阅片研究,但样本量(9名医生)相对较小,可能不足以完全代表广泛的临床放射科医生群体。不同医疗机构、不同设备厂商的超声影像特征存在差异,模型的推广适应能力仍需在更大规模的真实临床环境中进一步验证。
其次,合成数据虽然降低了捷径学习偏差,但其临床应用价值还需要进一步的实际验证。在真实临床工作流中,是否能够有效利用合成数据来训练更好的诊断模型,还需要进行额外的研究。
最后,任何AI诊断工具都应被视为医生的辅助手段而非替代品。临床医生在使用这类工具时,仍需要结合患者的临床表现、病史、其他检查结果等信息进行综合判断。
Original paper: A foundation generative model for breast ultrasound image analysis. — Nature Biomedical Engineering. 10.1038/s41551-026-01639-1