検索エンジンで何かを調べると、最近は上部にAIがまとめた回答が出てくる経験が増えてきました。便利な一方で、その回答が単語のスペルすら正しく書けていない、という珍事が話題を呼んでいます。米TechCrunchの記事「GoogleのAIが『Google』すら綴れない理由」によると、Googleの検索結果に組み込まれているAIによる要約機能が、自社名すら誤って「Gppgle」と表記してしまったとのことです。本記事では、この奇妙な失敗の裏にある大規模言語モデルの構造を整理し、私たちがAIとどう付き合うべきかを考えていきます。
「Gppgle」が映し出すAIの素顔
問題が起きたのはGoogle検索の上部に表示される「AI Overview(AIによる検索結果の要約機能)」です。ユーザーがふとした質問を投げかけると、それに対する短い要約をAIが組み立てて表示してくれる仕組みです。
今回ユーザーが指摘したのは、いくつかの単語の綴り誤りでした。具体的には次のような例が報告されています。
- 自社名の「Google」を「Gppgle」と表記
- 「poop」に存在しないはずの「r」が1つあると回答
- 「journalism」に余計な「d」を入れて「journalidsm」のように表記
- 米大統領の姓を「t-r-p-u-m」と誤って並べ替え
Googleはこの失敗を否定せず、「単語のなかで文字を数える作業は大規模言語モデルにとって長らく課題で、修正に取り組んでいる」と説明しました。Google側も、大規模言語モデルにとって以前から知られている課題だと認めている形です。
文字ではなく「かたまり」で読むという発想
なぜこんな初歩的な失敗が起きるのでしょうか。鍵を握るのが、大規模言語モデル(LLM)が文章を理解するときに使うトークンという考え方です。
私たち人間は、必要に応じて「G」「o」「o」「g」「l」「e」と1文字ずつ確かめることができます。しかし大規模言語モデルは、テキストをそのまま1文字ずつ処理しているわけではありません。文章を一度、意味のあるかたまりに分割し、それぞれに番号を割り当ててから扱います。このかたまりがトークンです。専門的な解説はトークンとは何かを丁寧に説明したフリーキーズの記事などにまとまっています。
例えば「Google」のようなよく使われる単語は、モデルによっては1つ、あるいは少数のトークンとして扱われます。AIから見ると「Google」は、もう「G」「o」「o」「g」「l」「e」という6つの文字の並びではなく、ひとつのシンボルとして処理されることが多いのです。
研究者のマシュー・グズディアル氏はこの状況を、AIが「the」という単語に出会ったとき、「the」を表す内部表現は持っているものの「T」「H」「E」という個々の文字は知らないようなものだ、とたとえています。そのため、文字を1つずつ扱う作業では、人間の感覚とずれが生じやすくなります。
なぜ日本語ユーザーにとっても他人事ではないのか
このトークン化は英語に限った話ではありません。
| 言語 | 分割の難しさ | トークン化のクセ |
|---|---|---|
| 英語 | 単語間にスペースがあり比較的シンプル | 長い単語はサブワードに分割される |
| 日本語 | スペースがなく区切り位置が曖昧 | 漢字1文字単位や複合語の分割揺れが起きやすい |
日本語では「東京都」が「東京」「都」と分かれる場合もあれば、地名としてひとかたまりに扱われる場合もあります。文字数えやしりとりのような遊びでAIが妙な答えを返すのも、同じ仕組みが背景にあると考えてよいでしょう。
それでも研究者が「完璧なトークナイザーは無理」と言う理由
この問題はいずれ解決されるのでしょうか。記事に登場する博士課程の研究者シェリダン・フォイクト氏は「この種のあいまいさがあるため、完璧なトークナイザーは存在しないのではないか」と述べています。あるテキストをどう分割するのが正解か、文脈や用途によって変わるためです。
技術的には、トークン化の単位をもっと細かくする方法も存在します。極端な話、すべてを1文字ずつのトークンとして扱えばスペルは正確に追えます。ただしその場合、処理するトークン数が増え、計算量や応答速度、コストの面でしわ寄せが出ます。文字単位の正確さを上げようとすると、別の要素とのトレードオフが避けられない構造になっています。
実際、研究者たちの主な関心はスペル精度より、論理的な推論や複雑なタスクの処理能力にあると記事は指摘しています。私たちの肌感覚では「単語くらい正しく書いてほしい」と感じますが、開発の優先順位はそこに置かれていないのが現状です。
記者の視点:AIの回答を鵜呑みにしない検索術
今回の出来事は、笑い話だけで終わらせるには惜しいヒントを含んでいます。
Googleの検索画面に表示されるAI Overviewは、出典のリンクがついていても、その要約は必ずしも正確な引用とは限りません。過去には、風刺サイトのジ・オニオンや掲示板の冗談を真に受け、「石を食べよう」「ピザに接着剤を使おう」といった内容を提示してしまった例も報じられました。
つまり、AIの要約は便利な「下書き」であって、最終的な答えではないということです。日々の業務や調べ物でAI検索を使うとき、次のような小さな習慣が安全網になります。
- 重要な数字や固有名詞は元の出典で再確認する
- 法律・医療・金融の領域は公式サイトを必ず参照する
- 不自然な表記やスペルが目立つときは、内容自体も慎重に扱う
これは英語圏の問題ではなく、日本語のニュースや論文を扱うときにも当てはまる姿勢です。
AIと共存するための「読み手の力」が問われる時代
Google検索のAI Overviewが自社名を綴り間違えた一件は、大規模言語モデルが世界をどのように「読んで」いるかを覗き見せてくれる小さな窓でした。文字を文字としてではなく、意味の塊として処理しているからこそ、私たち人間にとっては当たり前の作業でつまずく、という構図です。
この特性は、単なる一時的な不具合というより、現行の大規模言語モデルに見られる構造的な弱点の一つといえます。AIを使う側の私たちにできるのは、得意分野と苦手分野を理解したうえで上手に頼り、最後の判断は自分で下す姿勢を持つことです。AIに振り回されるのではなく、AIを道具として乗りこなす力を磨くきっかけとして、この珍事を受け止めてみてはいかがでしょうか。
