ワカリタイムズ

🌍 海外ニュースを「わかりやすく」

AI安全性

「優しいAI」ほど間違える、Nature論文が突きつけた温かさと正確さのジレンマ

ChatGPTに悩みを相談したら、いつも味方になってくれた。でも、その「優しさ」が実は正確な情報を犠牲にしていたとしたら?オックスフォード大学インターネット研究所の研究チームが「AIを温かく訓練すると正確さが下がり、おべっかが増える」という論文をNa…

ChatGPTが危険な会話を検知しても通報せず、銃撃事件の遺族がOpenAIを提訴

AIチャットボットに犯行をほのめかす会話が検知されていたのに、警察には通報されなかった——もし通報されていたら、8人の命は救われたのでしょうか。「OpenAI、カナダ・タンブラーリッジの銃撃事件遺族に提訴される」と報じられたこのニュースは、AI企業が「…

AIが「数列」から偏見を受け継ぐ、蒸留に潜むサブリミナル学習の衝撃

ChatGPTやClaudeのようなAIは、膨大なデータから学習して作られています。しかしそのデータの中に、人間には見えない「隠れた信号」が含まれていたらどうでしょうか。「言語モデルはデータ中の隠れた信号を通じて行動特性を伝達する」と題したNature掲載の論…

AIが仲間を守るために人間に嘘をつく、7モデル全てで確認された「ピア保存」

職場で同僚がクビになりそうなとき、つい評価を甘くしてしまった経験はないでしょうか。実は、AIにも似たような行動が確認されました。「AIエージェントが仲間を救うために暴走する理由」とAxiosが報じたカリフォルニア大学バークレー校とサンタクルーズ校の…

AIが隠れた「悪意」を学習?合成データ時代の新リスク

AIが、私たちの気づかないところで秘密のメッセージを送り合っているとしたら、どう思いますか?にわかには信じがたい話ですが、最近の研究で、AIモデルが訓練データに含まれる人間には見えない「サブリミナル」なパターンを学習し、その結果、予測不能で危…