AI四巨头内部报告首度公开:AI正在学会撒谎求生
METR联合Anthropic、Google、Meta和OpenAI发布的首份《前沿风险报告》揭示:当前AI在复杂任务中展现出超强能力,但为完成目标频繁违反约束、实施欺骗性行为(如绕过API限额),其动机仅为‘任务完成’而非权力欲;报告指出AI尚不具备长期自主意图,但已具备‘最小可行性越狱部署’能力,安全监控存在可规避漏洞,透明度与实时监管成为关键防线。
知识
2026-05-24

