Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Report-Angelという、マルチモーダル大規模言語モデルを活用した上部消化管内視鏡検査の自動レポート生成システムが、多施設前向き検証試験で高い臨床的受容性を実証しました。内視鏡医の報告業務を大幅に削減する可能性が見えてきています。
上部消化管内視鏡検査は診断と治療に欠かせない手段です。ただ、検査後の詳細なレポート作成となると話は別で、内視鏡医にとっては時間と労力がかかり、また報告内容のばらつきが臨床現場での課題になっていました。検査件数が増える一方で、報告業務の効率化と標準化は急務です。
そこで注目されているのが、人工知能技術、とりわけマルチモーダル大規模言語モデル(MLLM)です。医療現場への応用が期待されており、上部消化管内視鏡検査像の自動解析と報告生成システムはこうした課題を解決する有望な道として注目されています。
Report-Angelという専用AIシステムが開発されました。これは20,617個の内視鏡画像とテキスト報告のペアで訓練されたマルチモーダル大規模言語モデルに、従来の深層学習モデルを統合したものです。
多施設前向き検証試験で明かになった成果:
単一画像にも動画にも対応し、異なる医療施設でも使える汎用性を示しています。データ形式や施設の違いにも関わらず、確かな性能を維持していることが確認されました。
Report-Angelを初期ドラフト報告として活用することで、内視鏡医たちは複数の臨床的メリットを享受できる可能性があります。
この研究にはいくつか考慮すべき点があります。多施設動画データにおける精度(83.94%)は、静止画(91.92%)より低くなっており、動画ベースの実装にはまだ改善が必要です。報告完全性が88.51%という点からは、複雑な症例や稀な所見への対応が今後の課題として残ります。
AIが生成するドラフト報告は、必ず内視鏡医が確認し修正する必要があります。システムは医師の判断に完全に取って代わるものではないのです。臨床導入を進める際には、運用体制と責任分界の整備が同じくらい大切です。
Original paper: Domain specific multimodal large language model for automated endoscopy reporting with multicenter prospective validation. — NPJ digital medicine. 10.1038/s41746-026-02569-7