「この言葉の意味は?」と聞かれたとき、辞書を引く代わりにChatGPTに尋ねる人が増えています。しかしそのAIが、辞書や百科事典の内容を無断で取り込んで学習していたとしたらどうでしょうか。「辞書がOpenAIを訴えた」というTechCrunchの記事が伝えるところによると、ブリタニカ百科事典を展開するブリタニカと、その傘下の英語辞書出版社メリアム・ウェブスターが、OpenAIを著作権侵害で訴えました。約10万件もの記事が無断で学習に使われたという主張は、AIと「知の権利」をめぐる争いの最前線を示しています。
約10万件の記事が無断で「学習」された
訴状は2026年3月13日、ニューヨーク南部地区連邦地裁に提出されました。ブリタニカ側の主張はこうです。OpenAIは、ブリタニカが著作権を持つ約10万件のオンライン記事をスクレイピング(自動収集)し、ChatGPTなどの大規模言語モデルの学習データとして無断で使用した、というものです。
訴えの対象は学習だけにとどまりません。ブリタニカは、ChatGPTが回答を生成する際にブリタニカの記事を「丸ごと、または一部そのまま再現」していると主張しています。さらに、ChatGPTのRAG(検索拡張生成)機能にも問題があるとしています。RAGとは、AIがユーザーの質問に答える際、ウェブや外部データベースを検索して回答に反映する仕組みです。ブリタニカ側は、この過程でも自社コンテンツが無断利用されていると訴えています。
「ウソの引用」が信頼を壊す
注目すべきは、著作権だけでなく商標法(ランハム法)の侵害も訴えている点です。ChatGPTは時として、実際には存在しない情報をもっともらしく生成する「ハルシネーション(幻覚)」を起こします。ブリタニカの主張によると、ChatGPTが作り出した誤った情報をあたかもブリタニカの記事から引用したかのように表示するケースがあり、これが商標法に違反するというのです。
250年以上の歴史を持つブリタニカにとって、「信頼性」はブランドの根幹です。AIが誤情報にブリタニカの名前を結びつけることは、長年積み上げてきた信用を損なう行為だと訴状は強調しています。「ChatGPTは、ウェブ出版社から収益を奪い、出版社のコンテンツと直接競合する回答を生成している」とも述べており、AIによる経済的被害も争点の一つです。
出版業界vsAI企業、拡大する法廷闘争
ブリタニカの提訴は、AI業界に対する著作権訴訟の波の一つに過ぎません。ニューヨーク・タイムズ、デジタルメディア大手のジフ・デイビス(CNET、IGN、Mashableなどを傘下に持つ)、シカゴ・トリビューンやトロント・スターなど米国・カナダの新聞社も、同様にOpenAIを訴えています。さらにブリタニカは2025年9月、AI検索エンジンのPerplexityに対しても別途訴訟を起こしており、こちらは現在も係争中です。
一方、AI学習と著作権をめぐる法的判断は、まだ明確な前例が確立されていません。注目すべき先例としては、Anthropicの訴訟があります。連邦判事は、著作権のあるコンテンツをAIの学習データとして使用すること自体は「変容的利用」として合法と認めました。一方で、Anthropicが海賊版サイトから数百万冊の書籍を不正にダウンロードした行為は違法と判断されています。この訴訟では15億ドル(約2400億円)という著作権訴訟史上最大級の和解金が合意されました。
記者の視点:日本のAI著作権議論にも影響か
この訴訟が興味深いのは、「学習」「出力」「検索」「ハルシネーション」という4つの異なる角度からAI企業の責任を追及している点です。特にハルシネーションに伴う商標侵害という論点は新しく、今後の訴訟に影響を与える可能性があります。
日本では著作権法第30条の4により、AI学習目的でのデータ利用は比較的広く認められていますが、生成された内容が元の著作物と類似する場合には侵害にあたりうるという議論が続いています。ブリタニカの訴訟は、学習段階だけでなく出力段階の問題も正面から問うており、日本の議論にも示唆を与えるでしょう。
「知の出典」を守れるか、AIと出版の未来
辞書や百科事典は、単なる情報の集積ではありません。何十年もかけて専門家が検証し、編集し、更新してきた「信頼の結晶」です。AIがそうしたコンテンツを学習して便利なサービスを提供する一方で、情報の出典元が正当な対価を得られなければ、質の高い情報そのものが生まれなくなるかもしれません。
AI技術の進歩と知的財産の保護をどう両立させるか。ブリタニカの訴訟は、この問いに対する答えを法廷の場で求めています。判決の行方は、AIと情報産業の関係を大きく左右しそうです。
