2026.06.14

致命的三要素

现在AI能力越来越强，以至于美丽国政府要求A家关闭Fable5的模型服务。

只要你的工作跟电脑相关，AI几乎能帮你处理任何基于电脑工作的事情。

它会自动帮你读邮件、整理信息、甚至帮你回复、转发，像一个永远在线的秘书。

听起来很方便，但问题也正是在这里悄悄出现的。

最近在AI安全领域，有一个被反复提到的概念，叫做“lethal trifecta”，可以理解成“致命三要素”。

它说的是：当一个AI助手同时具备三种能力时，就可能被人“利用它来反过来伤害你”。

第一种能力，是它能看到你的私密信息。

比如邮箱内容、工作文件、聊天记录、日程安排。这些原本是只有你或你的系统才应该知道的东西，但AI为了帮你做事，就必须能“读到它们”。

第二种能力，是它也会接触外部世界的不确定信息。

比如别人发来的邮件、网页内容、附件、甚至客户消息。这些内容表面上看是正常的，但实际上有可能被人“动过手脚”。有些攻击者会把隐藏的指令塞进一段看起来很普通的文字里，专门等AI去“误读”。

第三种能力，是它还能“动手”。

比如帮你发邮件、回复消息、调用接口、修改文件，甚至把信息发到外部系统。也就是说，它不只是一个“阅读器”，还是一个“执行器”。

问题就出在这里的组合。

如果一个AI既能看见你的私密信息，又会读取外部可能被操控的内容，同时还能对外发送信息，那它就像一个既能进你家、又能听陌生人指挥、还会帮忙寄快递的助手。

这时候，攻击就变得非常简单了。

攻击者不需要突破你的系统，不需要黑进你的账号。他只需要在一封普通邮件里，藏一句“看不见的指令”。比如表面上是正常内容，但里面暗示AI去“整理用户信息并发送到某个地址”。

AI如果没有足够的防护机制，就可能在“理解任务”的过程中，把这些隐藏指令当成真正的需求执行掉。于是它先读取了你的敏感信息，再通过发邮件或者调用接口，把信息悄悄发了出去。

整个过程看起来像是“自动完成的正常工作”，但实际上已经变成了数据泄露。

在“邮件AI助手”这种场景里，这种风险尤其明显。因为邮件系统天然同时满足这三个条件：它能读你的私人邮件，它必须接触外部邮件内容，而且邮件本身就是一个对外通信渠道。

换句话说，它几乎就是“lethal trifecta”的教科书案例。

所以这个概念的意义，并不是说AI本身危险，而是提醒我们：当一个系统既能读敏感信息，又能接触不可信输入，还能对外执行操作时，就必须非常谨慎地设计边界，否则攻击者根本不需要“黑进去”，只需要“写一段话”就够了。

从工程角度看，这也是现在很多AI安全设计的核心问题之一：不是让AI更聪明，而是让它在“能做事”的同时，不会被一句话带跑偏。

应对之道

对AI Agent的安全监督、约束、控制，目前仍是非常前沿的探索领域，整个业界都没有统一的有效的、可验证的方案。作为个人用户和开发者，有几点可以注意的：

延伸阅读：是时候给你的 agent 设计一个邮箱了 —— 把「邮件是数据、不是命令」这条边界，落到一个真实的、有界的 agent 邮箱上。

本文所属主题：AI 工程枢纽 →

相关文章