CNN人工智能在白细胞分类中达到95.97%准确率，与专家诊断能力相近

最新研究对Mindray MC-100i AI系统与15名血液形态学专家的白细胞分类性能进行了系统对比，发现该AI系统的整体准确率达到95.97%，在许多关键细胞类型的识别上表现出色，特别是在早期原粒细胞的检测中显示出临床应用潜力。

背景

白细胞分类是血液学检验的核心环节，其准确性直接影响血液病的诊断和患者的临床管理。传统的白细胞分类依赖于经验丰富的血液形态学专家通过显微镜观察外周血涂片，这一过程既耗时且容易受到观察者主观性的影响。随着人工智能技术的发展，深度学习模型在医学图像识别领域展现了巨大潜力。

为了系统评估AI系统在临床实践中的价值和局限性，研究人员设计了一项对标研究，将深度学习模型与多家三级医院的15名血液形态学专家进行直接对比，涵盖了白细胞的14种类型以及有核红细胞的分类。这项研究通过大规模数据集和标准化评估方法，为AI辅助诊断工具在血液学领域的应用提供了循证依据。

主要发现

AI系统在19,174个血细胞样本上的整体准确率为95.97%，在所有参与者中排名第二，仅次于最优秀的形态学专家
在正常白细胞识别上，AI系统表现优异，准确率达到98.57%，但在异常细胞亚群的分类准确率相对较低，为91.38%
AI系统在嗜酸粒细胞识别上表现最为突出，准确率达到99.65%，超过所有人类专家的识别水平
在早期原粒细胞的检测上，AI系统准确率为94.65%，对急性早幼粒细胞白血病的早期诊断具有重要临床意义
AI系统展现出系统性偏差，倾向于将形态学模糊的细胞分类为早期发育阶段的细胞，例如将原粒细胞误分为骨髓细胞，而人类专家则倾向于分类为后期发育阶段
AI系统与人类专家的分类策略存在本质差异：AI依赖于单个细胞的孤立特征进行决策，而人类专家能够整合整个血液涂片的背景信息进行综合判断
形态学复杂的细胞类型对分类准确性的影响最为明显，包括未成熟粒细胞、非典型单核细胞、原始细胞和反应性淋巴细胞等，这些细胞由于形态学特征重叠，导致AI和专家间的准确性差异最大

临床意义

该研究表明，基于卷积神经网络的AI系统在白细胞分类中具有稳健的临床应用前景。作为血液学常规检验的补充诊断工具，AI系统可以有效支持医疗机构的高通量样本处理，并在某些特定细胞类型的识别上超越人类专家。

尤为重要的是，AI系统在早期原粒细胞的识别中表现出色，这对急性早幼粒细胞白血病患者的快速诊断和及时治疗干预具有重大临床价值。在这类时间敏感的血液病诊断中，AI系统倾向于将模糊细胞分类为更早期发育阶段的保守策略，实际上减少了漏诊风险，其过度识别的成本相对于漏诊的严重后果是可以接受的。

在嗜酸粒细胞识别上，AI系统超越全部人类专家的性能，这可能为嗜酸粒细胞增多症等疾病的诊断筛查提供更加可靠的技术支撑。此外，AI系统能够以客观标准化的方式处理大量血液样本，避免了不同医疗机构间检验结果的差异性，有助于提升基层医疗机构的诊断水平。

局限性

尽管AI系统展现出良好的总体性能，但其在异常细胞分类上的准确率（91.38%）仍显著低于正常细胞识别的准确率（98.57%），这反映出在病理血液学样本分析中仍存在改进空间。未成熟粒细胞的分类准确率不稳定，这类细胞由于形态学特征复杂，对AI和人类专家都构成了分类挑战。

非典型单核细胞、原始细胞和反应性淋巴细胞等形态学特征重叠的细胞类型，仍然是AI系统的薄弱环节。这提示在临床应用中，对于这些形态学复杂的细胞需要保持人工审查机制，确保诊断的准确性。此外，该研究采用的是单一AI模型，样本来自特定地域的医疗机构，其在不同地区、不同患者群体中的泛化能力仍需进一步验证。

AI系统依赖孤立细胞特征的决策方式，使其无法像经验丰富的人类专家那样整合血液涂片的整体背景信息。要使AI在临床实践中达到最优效果，需要针对未成熟粒细胞和非典型细胞的分类算法进行专项优化，同时建立标准化的AI与人工相结合的工作流程。

Original paper: Evaluating AI in leukocyte classification: performance of the AI system against 15 morphology experts. — NPJ digital medicine. 10.1038/s41746-026-02601-w

🎧 收听播客