乳腺超声AI基础模型BUSGen：诊断准确率突破人类医生水平

一项发表在《Nature Biomedical Engineering》上的研究介绍了BUSGen，首个针对乳腺超声图像分析的基础生成模型。该模型在早期乳腺癌诊断中的表现超越了全部9名认证放射科医生，灵敏度平均提高16.5%。

背景

乳腺癌是全球女性最常见的癌症之一，早期诊断对改善患者预后至关重要。乳腺超声因其无放射线辐射、成本低、易于获取等优势，已成为乳腺癌筛查的重要工具。然而，超声诊断高度依赖医生的经验和技能，诊断结果存在显著的医生间差异。同时，医学影像数据的隐私敏感性和数据获取困难，也制约了人工智能模型在这一领域的发展。

为解决这些问题，研究团队开发了BUSGen——一个基于扩散模型的基础生成模型。与传统的只能进行单一任务（如良恶性分类）的AI模型不同，基础生成模型能够学习医学影像的底层特征，并通过少量样本快速适应多种临床任务。这种方法不仅有望提升诊断准确率，还能生成逼真的合成医学影像，为隐私保护提供新途径。

研究方法简述

研究团队利用350万例乳腺超声图像对BUSGen进行预训练。这个庞大的数据集使模型能够全面学习乳腺的正常结构、病理特征和临床变异表现。模型采用了基于U-Net架构的扩散神经网络，并通过LoRA微调技术实现了高效的少样本适应。

研究通过两个主要途径评估了BUSGen的性能：一是在下游分类任务中与其他AI方法比较；二是进行临床阅片研究，直接比较AI诊断性能与9名董事会认证放射科医生的诊断结果。此外，研究还评估了合成数据的生成质量，以及合成数据对模型泛化能力的影响。

主要发现

诊断性能超越人类医生：BUSGen在早期乳腺癌诊断中的表现超越了全部9名认证放射科医生，灵敏度平均提高了16.5%（P<0.0001）。这意味着该模型能够识别出更多处于早期的乳腺癌病变。
生成高质量任务特异性合成数据：通过少量样本的适应学习，BUSGen能够生成逼真且具有信息量的任务特异性合成医学影像。这些合成影像可用于多种临床应用场景。
减少模型的捷径学习偏差：模型生成的合成数据表现出更低的捷径学习偏差（AUC值0.493），相比之下真实数据的AUC值为0.600。这表明合成数据能够帮助AI模型学习更本质的医学特征，而非依赖数据中的虚假关联，从而显著改进模型的泛化能力。

临床意义与应用前景

BUSGen的出现具有重要的临床和科学意义。首先，在诊断性能方面，该模型超越人类放射科医生的表现表明，AI辅助诊断有潜力显著提升乳腺癌的检出率，特别是早期病变的发现。这对降低乳腺癌死亡率、改善患者预后具有重要意义。

其次，BUSGen的合成数据生成能力为医学AI发展中的关键难题——数据隐私保护提供了创新解决方案。医学影像数据涉及患者隐私，获取和共享受到严格限制，这往往成为多机构合作研究的瓶颈。BUSGen生成的合成影像既保留了临床诊断的关键信息，又不含真实患者隐私数据。这使得医学AI模型可以在尊重患者隐私的前提下进行更广泛的开发和验证。

此外，该基础模型的泛化能力强，能够通过少量样本快速适应各种乳腺超声分析任务。这意味着同一个基础模型可以支持良恶性分类、病灶类型识别、风险评估等多项临床应用，提高了医学AI开发的效率。对于医疗资源相对不足的地区和机构，这种方法可以帮助提升乳腺癌诊断的标准化和可及性。

局限性与后续考虑

尽管BUSGen取得了令人瞩目的成绩，但研究也存在若干局限。首先，该研究主要基于计算方法的评估。虽然进行了临床阅片研究，但样本量（9名医生）相对较小，可能不足以完全代表广泛的临床放射科医生群体。不同医疗机构、不同设备厂商的超声影像特征存在差异，模型的推广适应能力仍需在更大规模的真实临床环境中进一步验证。

其次，合成数据虽然降低了捷径学习偏差，但其临床应用价值还需要进一步的实际验证。在真实临床工作流中，是否能够有效利用合成数据来训练更好的诊断模型，还需要进行额外的研究。

最后，任何AI诊断工具都应被视为医生的辅助手段而非替代品。临床医生在使用这类工具时，仍需要结合患者的临床表现、病史、其他检查结果等信息进行综合判断。

Original paper: A foundation generative model for breast ultrasound image analysis. — Nature Biomedical Engineering. 10.1038/s41551-026-01639-1

🎧 收听播客