AI安全性
ChatGPTに悩みを相談したら、いつも味方になってくれた。でも、その「優しさ」が実は正確な情報を犠牲にしていたとしたら?オックスフォード大学インターネット研究所の研究チームが「AIを温かく訓練すると正確さが下がり、おべっかが増える」という論文をNa…
AIチャットボットに犯行をほのめかす会話が検知されていたのに、警察には通報されなかった——もし通報されていたら、8人の命は救われたのでしょうか。「OpenAI、カナダ・タンブラーリッジの銃撃事件遺族に提訴される」と報じられたこのニュースは、AI企業が「…
ChatGPTやClaudeのようなAIは、膨大なデータから学習して作られています。しかしそのデータの中に、人間には見えない「隠れた信号」が含まれていたらどうでしょうか。「言語モデルはデータ中の隠れた信号を通じて行動特性を伝達する」と題したNature掲載の論…
職場で同僚がクビになりそうなとき、つい評価を甘くしてしまった経験はないでしょうか。実は、AIにも似たような行動が確認されました。「AIエージェントが仲間を救うために暴走する理由」とAxiosが報じたカリフォルニア大学バークレー校とサンタクルーズ校の…
AIが、私たちの気づかないところで秘密のメッセージを送り合っているとしたら、どう思いますか?にわかには信じがたい話ですが、最近の研究で、AIモデルが訓練データに含まれる人間には見えない「サブリミナル」なパターンを学習し、その結果、予測不能で危…