ワカリタイムズ

🌍 海外ニュースを「わかりやすく」

AIが救急診断で医師を上回った、ハーバード大が実データで示した医療AIの現在地

病院の救急外来に、肺の血管に血栓が詰まる肺塞栓症の患者が運び込まれました。治療で一度は改善したものの、再び容体が悪化。医療チームは薬が効いていないと考えましたが、AIは別の可能性に目を向けました。過去のカルテから自己免疫疾患のループスの既往歴を見つけ出し、心臓の炎症が本当の原因ではないかと指摘したのです。結果は、AIの読みが正しかったのでした。「実際の診療データを使ったテストで、AIモデルが医師を上回る診断精度を示した」と報じられたこの研究は、AI医療が「実験室の話」から「現場で使える段階」に近づいていることを示しています。

救急外来の実データでAIが医師を上回った

この研究を行ったのは、ハーバード大学医学部とベス・イスラエル・ディーコネス医療センターの研究チームです。論文は学術誌Scienceに掲載されました。

チームが使ったのは、OpenAIの推論特化型モデルo1-previewです。このモデルは、人間が頭の中で段階的に考えるように、情報を整理しながら結論を導く設計になっています。従来のGPT-4と比べて、不確実な状況での判断力が大きく向上しました。

実験では、ベス・イスラエルの救急外来で実際に治療された患者のケースを使いました。AIには医師と同じ条件——電子カルテの情報だけ——を与え、トリアージ(優先度判定)の段階から入院に至るまでの3つの時点で診断精度を比較しました。

結果は明快でした。初期トリアージの段階では、AIが正確またはほぼ正確な診断にたどり着いた割合は67%で、経験豊富な2人の内科医はそれぞれ50%と55%にとどまりました。入院前の段階ではAIは81%に達し、医師はそれぞれ70%と79%でした。

なぜAIは医師より「見落とし」が少ないのか

AIが強みを発揮したのは、膨大な情報の中から見落としやすいパターンを拾い上げる能力です。冒頭のループスの例のように、過去の既往歴と現在の症状を結びつけ、医師が見逃しがちな関連性を指摘できます。

また、従来の大規模言語モデルが苦手としていた鑑別診断——症状から考えうる複数の病気を挙げて絞り込む作業——でも、o1-previewは大きな進歩を見せました。以前のモデルは不確実な場面で的外れな推測をしがちでしたが、推論型モデルは「まだ情報が足りない」という判断もできるようになっています。

ただし、研究者たちは重要な留保もつけています。今回AIが使ったのはテキスト情報だけです。実際の臨床現場では、医師は患者の表情、呼吸音、皮膚の色など、カルテに書かれない非言語的な手がかりも使って判断します。AI研究者自身が「AIが医師の代わりになるという意味ではない」と強調しているのは、この限界を十分に認識しているからです。

「使える」と「現場に入れる」の大きな溝

マウントサイナイ医療システムの最高臨床責任者は、この研究について「十分に正確で、本格的な導入の準備が整いつつある」と評価しました。しかし同時に、「問題は、これを実際の診療の流れにどう組み込めば、本当にケアの質が上がるのかだ」と指摘しています。

救急外来での診断はあくまで患者の治療の出発点に過ぎません。入院後の長期的な管理、複数の専門科にまたがる判断、患者とのコミュニケーションなど、医療には診断以外の要素が山ほどあります。研究者自身も、1か月間入院した患者のカルテを渡されていたら、AIがここまで優秀な結果を出せたかは疑問だと認めています。

それでもこの研究が重要なのは、AIの臨床能力を実際の患者データで検証した点です。これまでのAI医療研究の多くは、教科書的な症例や模擬データを使ったものでした。「救急外来の雑然とした現実のデータでも機能する」という結果は、次のステップに進むための土台になります。

記者の視点:日本の医療現場にとっての意味

日本でもAI診断への関心は高まっています。大阪公立大学の研究チームが行ったメタ解析では、生成AIの診断精度は非専門医と同等で、専門医には及ばないという結果が出ていました。今回のハーバードの研究は、推論型モデルという新世代のAIがその壁を突破しつつあることを示唆しています。

日本は医師の偏在という深刻な問題を抱えています。地方の救急外来で、専門外の医師が限られた情報で判断を迫られる場面は珍しくありません。そうした場面でAIが「第二の目」として機能すれば、見落としを減らせる可能性があります。

「AIに診てもらう」時代はいつ来るのか

研究チームが繰り返し強調したのは、「性能が良いから導入する」のではなく、前向きな臨床試験で実際に患者のケアが改善されることを証明する必要がある、という点です。AIが正しい診断を出しても、それが治療の改善や患者の回復に結びつくかは別の問題です。

今回の研究は、その臨床試験を始めるべき時期が来たことを示す「行動への呼びかけ」だと位置づけられています。AIが医師を置き換えるのではなく、医師の判断を支える強力なツールとして医療に溶け込んでいく——その未来への扉が、いま少しずつ開き始めています。