稀がんの診断をAIが変える:少データで高精度な亜型分類を実現

視覚言語基盤モデルとプロンプトチューニングを組み合わせたフレームワーク「PathPT」により、データが限定される稀がんの亜型分類を少数のサンプルから高精度に実現できることが実証されました。臨床への導入が見込まれる、参考にすべき新知見です。

背景

稀がんの亜型分類は病理診断の中でも特に困難な領域です。症例数が少ないため、AIモデル開発に必要な大量の注釈付きデータが得られず、その分野の専門医も世界的に限定されています。従来の深層学習では、こうしたデータ不足に対応できないため、診断精度の向上には膨大な教師データが前提とされてきました。最近の視覚言語基盤モデルは、既存の大規模画像テキスト学習から得た知識を活用して、少量データからの学習(few-shot learning)を可能にする新たな可能性を提供します。

主な発見

  • 脳腫瘍30亜型(EBRAINSデータセット)で10ショット学習時に0.679のバランス精度を達成し、zero-shot baseline比で0.271ポイント改善しました
  • 小児稀がん(神経芽細胞腫、肝芽腫、髄芽腫、腎芽腫)では、従来の複数インスタンス学習ベースラインと比較して20ポイント以上の精度向上を達成しました
  • 異機関間での汎化性能を確認でき、一機関で学習したモデルを別機関データに適用した際、zero-shot比で0.09のバランス精度改善を実現しました
  • 腫瘍領域のセグメンテーション精度も向上し、5ショット学習ではDICEスコアが0.239から0.618に大幅改善しました
  • 11のがん種、56亜型、3,958枚のWSI(全スライド画像)での包括的な検証により、広範な有効性が確認されました

臨床的意義

PathPTは、臨床現場への導入を想定した、パラメータ効率的なソリューションを実現します。新しいがん亜型や施設への急速な適応が最小限のデータで可能であるため、資源制約のある医療機関での実装が現実的です。特に重要なのは、このフレームワークが病理標本の局所領域(タイル)レベルの予測と、その根拠を解釈可能な形で提供することです。病理医がAI出力を検証し、医学的判断の信頼性を確保できます。データと専門医が限定される地域での稀がん診断の質向上に、大きな貢献が期待されます。

限界

本研究は計算機的な検証に基づいており、実際の臨床ワークフロー環境での評価はまだ行われていません。モデルの性能は使用される基盤モデルの品質に大きく依存するため、異なるビジョンモデルやテキストエンコーダの影響については追加検討が必要です。また、含まれるデータセットが主に特定地域の医療機関由来であるため、より広範な人口集団への汎化性能の検証が重要です。タイル生成と疑似ラベル割り当ての最適化方法についても、標準化と改善の余地があります。

Original paper: Boosting pathology foundation models via few-shot prompt-tuning for rare cancer subtyping. — Nature communications. 10.1038/s41467-026-71715-2