1. m3.com
  2. AI Lab
  3. 大規模言語モデルと医師の困難症例診断比較

大規模言語モデルと医師の困難症例診断比較

2025年4月9日(水)    m3.com AI Lab (植田大樹)   

複数の大規模言語モデルを用いて消化器症状を中心とする難解症例の診断能力を検証し、特にClaude 3.5 Sonnetが熟練医師より高い診断カバレッジ率(76.1%)を示した研究である。

対象は、難治性疾患として実際に報告された67例の消化器主訴症例である。これらを大規模言語モデル(LLM)7種と消化器内科の熟練医師22名に提示し、複数の候補診断と最も可能性の高い診断を求めた。評...