精神医学のAI診断能力は実用段階か？最新ベンチマーク研究が示す課題と可能性

MedAI Digest (JA)

MedAI Digest (JA)

精神医学のAI診断能力は実用段階か？最新ベンチマーク研究が示す課題と可能性

00:00 /

精神医学分野の大規模言語モデル（LLM）ベンチマーク「PsychiatryBench」が2026年4月14日に発表されました。最先端のAIモデルは高い精度を示す一方で、複雑な臨床判断やリスク評価には課題が残ることが明らかになりました。

Original paper: PsychiatryBench: a multi-task benchmark for LLMs in psychiatry. — NPJ digital medicine. 10.1038/s41746-026-02582-w

📄 記事を読む