医療における大規模言語モデルのメタ認知不足

2025年2月24日（月） m3.com AI Lab （植田大樹）

大規模言語モデルは医学的な多肢選択問題で高い正答率を示す一方、自らの知識が不十分な領域を的確に把握できない。安全な臨床応用には注意が必要である。

本論文は、大規模言語モデル（LLM）の医療領域でのパフォーマンスに着目し、従来の複数選択式テストだけでは評価しきれない「メタ認知能力」の不足を指摘している。研究チームはMetaMedQAという新...