何かを調べたいとき、まずGoogleで検索する人は多いでしょう。最近ではその検索結果の一番上に、AIが生成した要約「AI Overviews」が表示されるようになりました。しかし、このAI回答の10回に1回は間違っていることが明らかになりました。「テストが示すGoogle AI Overviewsは毎時数百万の嘘をつく」とArs Technicaが報じたこの分析結果は、AI時代の情報検索が抱える根本的な問題を浮き彫りにしています。
「正解率91%」の裏にある巨大な数字
今回の分析は、ニューヨーク・タイムズがAIスタートアップのOumiと共同で実施しました。テストに使われたのは、OpenAIが2024年に公開したSimpleQAというベンチマークです。検証可能な答えがある4,000問以上の事実確認問題で構成されており、AIモデルの正確性を測る標準的な指標として使われています。
昨年、Gemini 2.5が最新モデルだった時点では正答率は85%でした。Gemini 3にアップデートされた後に再テストすると、正答率は91%に改善しました。一見すると高い数字に思えます。
しかし、Googleは年間5兆回以上の検索を処理しています。9%の誤り率をこの規模に当てはめると、毎時約5,700万件もの不正確な回答が生み出されている計算になります。90%の正答率は、試験の点数としては合格ラインかもしれません。しかし、世界中の人々が日常的に頼る検索エンジンとしては、話が違ってきます。
「正解」でも根拠がない回答が急増
問題は不正解だけにとどまりません。分析では、正解とされた回答の半数以上が「根拠なし」だったことも判明しました。つまり、引用元のWebページに回答内容の裏付けが記載されていなかったのです。
この「根拠なし」の割合は、Gemini 2時代の37%からGemini 3では56%に増加しています。モデルが賢くなって正答率は上がったものの、情報ソースとの整合性はむしろ悪化しているという皮肉な結果です。
具体的な誤りの例も報告されています。ボブ・マーリーの旧宅が博物館になった時期を尋ねると、AI Overviewsは3つのページを引用しましたが、そのうち2つは時期に言及しておらず、残りのWikipediaには矛盾する2つの年が記載されていました。AI Overviewsは自信満々に誤った方を選んでいます。
コストと精度のジレンマ
AI Overviewsの精度が安定しない背景には、技術的な事情があります。Googleはすべての検索に同じモデルを使っているわけではなく、クエリごとに「適切なモデル」を選んでいると説明しています。
最高精度を出すなら常にGemini 3.1 Proを使えばいいのですが、それでは処理が遅くコストもかさみます。そのため、大部分の検索には高速だが精度で劣るGemini Flashモデルが使われているとみられます。検索結果を素早く表示するために、正確さが犠牲になっているのです。
Googleの広報担当者はこのテスト自体に異議を唱え、「この調査には重大な欠陥がある。人々が実際にGoogleで検索する内容を反映していない」と述べました。Google社内ではSimpleQAの改良版であるSimpleQA Verifiedを使っており、より厳密に検証された少数の質問セットで評価しているといいます。
記者の視点:「再確認してください」は免罪符になるか
Google自身がAI Overviewsの末尾に「AIは間違えることがあります。回答を再確認してください」と注記していることは注目に値します。この一文は、Googleが自社のAI回答の不完全さを認めていることの証拠でもあります。
しかし現実には、検索結果の最上部にAIの回答が大きく表示されれば、多くの人はそれをそのまま信じるでしょう。従来の「青いリンク」をクリックして複数のソースを確認する人がどれだけいるかは疑問です。AI Overviewsは便利である一方、ユーザーが情報の真偽を自分で確かめる行動を減らしてしまうリスクがあります。
日本でもGoogle検索のAI回答は徐々に普及しています。英語圏で起きている問題は、いずれ日本語の検索でも表面化する可能性があります。「AIが言っているから正しい」という思い込みは、10回に1回、私たちを間違った方向に導くかもしれません。
AI検索時代に求められるリテラシー
検索エンジンは長年、情報への入り口として信頼されてきました。しかしAI生成の要約が最前面に出る時代には、利用者にも新しいリテラシーが求められます。AIの回答を出発点として使いつつ、重要な判断の前には元のソースに当たる習慣を持つこと。それが、便利さと正確さを両立するための現実的な対策です。Googleが精度を改善し続けることは期待できますが、10回に1回の誤りがゼロになる日は、まだ先のことでしょう。
