マルチエージェントAIが肝臓移植選定委員会をシミュレート—客観的で公正な医療判断へ

マルチエージェント型の大規模言語モデル（LLM）システムが、肝臓移植の候補者選定プロセスで医学的判断と公正性を備えた意思決定を実現できることが明らかになった。

背景

肝臓移植は生命を救う重要な治療法ですが、提供臓器の数は限られており、限定されたリソースの中で誰を優先して移植するかという複雑な医療判断が必要とされます。この選定過程では、複数の診療科の専門家から成る委員会が、臨床データと患者の背景情報を総合的に評価しますが、判断の一貫性や公正性にばらつきが生じるリスクがあります。近年、人工知能技術の発展により、医療判断の客観化と標準化を図る取り組みが進められています。本研究では、複数のAIエージェントを組み合わせたシステムが、従来の多職種委員会と同様に機能し、さらにバイアスを低減できるかどうかを検証しました。

主な発見

1年生存予測の精度：92.00%（95%信頼区間 91.43–92.58）。感度は完全（1.00）であり、リスク患者の見落としが極めて少ないことが特徴です。一方、特異度は0.66と相対的に低く、一部の患者が誤って候補から除外されました
絶対的禁忌の特定：98.19%の高い精度（95%信頼区間 97.90–98.44）を達成し、感度1.00、特異度0.91を示しました。移植に適さない患者を確実に識別できることが示されました
6ヶ月生存予測の精度：94.88%（95%信頼区間 94.37–95.29）で、1年予測と同様に高い感度（1.00）を保持しました
誤判定の主要因：偽陰性の61～62%は肝細胞がんがMilan基準を満たさないケースでした。偽陽性ケースの死因は、1年後の悪性腫瘍が28%と最多でした
公正性の実証：すべての人口統計学的グループにおいて差別的影響スコア≥0.960を示し、人種・性別などの属性による選定バイアスがないことが確認されました

臨床的意義

本研究の成果は、複数のLLMベースのAIエージェントを医療意思決定に組み込む可能性を示しています。肝臓移植医、外科医、心臓医、ソーシャルワーカーの4つの役割を担うAIエージェントが協働することで、単一の判断者による主観的な決定を避け、より客観的で一貫性のある判断が実現されました。

特に注目すべきは、異なる人口統計学的背景を持つ患者群に対して、公正な判断が維持されたという点です。これは医療の公正性と格差是正という現代的な課題に対する有意義な知見です。本フレームワークは肝臓移植選定プロセスの標準化を促進し、患者選定の透明性と再現性を向上させる可能性があります。さらに、腫瘍カンファレンスや臨床ラウンドなど、他の複雑な医療判断にも応用できる可能性が示唆されています。

限界

本研究はいくつかの重要な限界を有しています。第一に、感度が高い一方で特異度が中程度に留まった点です。特に偽陰性率の分析から、医学的に重要な臨床因子（肝細胞がんの進行度など）の判定にAIシステムの精度改善の余地があることが示唆されます。

第二に、本研究は米国の移植データベースを用いた後ろ向き研究であり、実臨床での運用性や患者転帰への実際の影響は別途検証が必要です。また、AIエージェントの判断プロセスの詳細な検証や、臨床医による解釈可能性の確保も今後の課題です。

Original paper: A multiagent large language model-based system to simulate the liver transplant selection committee: a retrospective cohort study. — The Lancet. Digital health. 10.1016/j.landig.2025.100966

🎧 ポッドキャストを聴く