「データ解析のコードを書くのに、また一週間がつぶれそうだ」。研究者や大学院生のあいだでは、よく聞かれるぼやきです。実はその「コードを書く時間」こそが、科学の進歩を大きく遅らせている要因の一つかもしれません。Googleの研究チームは2026年5月19日、論文「科学者が専門家レベルの実証ソフトウェアを書くのを助けるAIシステム」を世界的な科学誌Natureで公開しました。発表された「ERA」というAIは、シングルセル解析や感染症予測などの複数のベンチマークで、人間の専門家が開発してきたトップクラスの手法と同等以上の性能を示したといいます。今回はこの研究の中身と、日本の研究現場にもたらしうる影響を見ていきます。
ERAとは何をしてくれるシステムなのか
ERAは「Empirical Research Assistance」の略で、日本語にすると「実証研究アシスタント」となります。やってくれることは大きく分けて2つです。1つ目は、研究テーマと評価指標を渡すと、それを最大化するためのソフトウェア(コード)を自分で書くこと。2つ目は、書いたコードを実際に動かしてスコアを測り、より良いコードへと書き直し続けることです。
利用者が用意するのは「採点可能な課題」と呼ばれるセットで、内容はおおむね次の通りです。
- 問題の説明(何を予測したいのか、何を解析したいのか)
- 評価指標(精度、二乗誤差、IoUなど)
- 訓練用と検証用のデータ
- 関連する論文や手法のヒント(任意)
これを渡すとERAは、関連するアイデアを自分で発想し、それをコードとして書き起こし、サンドボックス(安全に隔離された実行環境)で動かして点数をつける、というサイクルを高速に繰り返します。研究者から見れば、頼んだ評価指標が最も良くなる「実用レベルのコード」が、最後に手元に届くというイメージです。
「LLM+ツリー探索」で何が変わったのか
ERAの肝は、大規模言語モデル(LLM)にツリー探索を組み合わせた点にあります。
LLM単体でコードを書かせる試みは、ChatGPTなどの登場以来たくさんありました。しかし「1回書いて終わり」では、複雑な研究課題ではどうしても精度が頭打ちになります。ERAはそこに、囲碁AI「AlphaZero」でも使われた木探索に通じる発想を、科学コードの改善に応用しました。
ツリー探索とは、選択肢を木のように枝分かれさせて広げ、有望な枝だけを残しながら深く探していく方法です。ERAでは、LLMがコードを書き換える1回1回が「木の枝」になります。良いスコアを出した枝の周辺を重点的に試し、ダメだった枝は早めに切り捨てます。これを数千通り規模で並列に回すことで、人間のチームでは現実的に試せない量のアイデアを比較できるようになりました。
研究チームは、Googleの大規模言語モデル「Gemini」をベースに、この仕組みを構築しています。
5つの分野で「人間越え」を達成
論文ではERAが5つの分野で、それぞれ既存のトップクラス手法を上回ったと報告されています。
| 分野 | 課題 | 結果 |
|---|---|---|
| シングルセル解析 | バッチ間の差を補正する手法 | 40種類の新手法を発見、代表的手法ComBatを約14%改善 |
| 感染症予測 | COVID-19の入院者数予測 | 14モデルが米国CDCの公式アンサンブル予測を上回る |
| 地理空間解析 | 衛星画像のセグメンテーション | IoU 0.80超を達成 |
| 神経科学 | ゼブラフィッシュの神経活動予測 | 7万個以上のニューロンで最先端性能 |
| 数学・時系列 | 難しい積分や時系列予測 | 19問中17問の難積分を計算、28データセットで一貫した予測ライブラリを構築 |
特に注目されているのが感染症予測の結果です。米国疾病予防管理センター(CDC)は、複数モデルを統合した「CovidHub Ensemble」というベンチマークを公表していますが、ERAが生成した14個のモデルが、これを精度で上回ったといいます。日本でも厚生労働省や国立感染症研究所が感染症の発生動向データを公開しており、こうしたデータを使った予測モデルの高度化にも応用余地がありそうです。
シングルセル解析でも、有名なバッチ補正手法ComBatとBBKNNを「組み合わせる」発想で、人間が長年積み上げてきた最高記録を約14%押し上げたとされています。
記者の視点:「研究者の机」から見える光と影
共著者のハーバード大学のマイケル・ブレナー教授は、ERAが人間の研究では見落としがちな有望な手法を探し出せる可能性を指摘しています。Googleの説明によれば、これまで数週間から数か月かかった探索を、数時間から数日に短縮できる手応えも得られているとのことです。
ここから見えてくるのは、研究のボトルネックが「アイデア出し」から「アイデアを片端から検証する」段階に移りつつある未来です。これは日本の大学や研究機関にとっても他人事ではありません。実験データはあるのに、コードや解析が追いつかず眠ったままになっている研究室は珍しくないからです。ERAのような仕組みが手に入れば、博士課程の学生1人が抱える計算実験を、一気に数十パターン並列で試すことも夢ではなくなります。
一方で、慎重さも必要です。ERAは「与えた評価指標を最大化する」装置なので、指標の設計を間違えると的外れな最適化を進めてしまいます。たとえば感染症予測なら「短期入院者数の二乗誤差」だけを追いかけ、リスクの高い高齢者だけが不正確に予測されるような結果に陥る可能性もあります。AIに任せる範囲が広がるほど、評価指標を決める人間の責任は重くなる、というのが正直なところでしょう。
Gemini for Science で身近になる科学研究AI
GoogleはERAを、2026年のI/Oイベントで発表した「Gemini for Science」関連ツールの一部として位置づけています。すでにAlphaEvolveなど別の研究向けAIと組み合わせた「Computational Discovery」プロトタイプも、Google LabsのTrusted Tester Programを通じて段階的に提供が始まっています。
数か月かかっていた実装が数時間から数日になれば、新薬の標的探索、感染症対策、気候モデル、材料探索といった社会的な急ぎ仕事に、より多くの研究者が挑戦できるようになります。日本でもAIを使った創薬や数理科学の研究が盛んになっており、こうしたツールを国内研究にどう取り込むかが、これからの大学と企業の競争力を左右しそうです。
ERAはあくまで「研究者の助手」ですが、その助手が時に人間より良い答えを出せるとなると、科学のあり方そのものがじわじわと変わっていくはずです。次に大きな発見をした論文の謝辞欄に、ふつうにAIアシスタントの名前が並ぶ未来も、もうそう遠くないのかもしれません。
