2026.06.14
致命的三要素

现在AI能力越来越强,以至于美丽国政府要求A家关闭Fable5的模型服务。
只要你的工作跟电脑相关,AI几乎能帮你处理任何基于电脑工作的事情。
它会自动帮你读邮件、整理信息、甚至帮你回复、转发,像一个永远在线的秘书。
听起来很方便,但问题也正是在这里悄悄出现的。
最近在AI安全领域,有一个被反复提到的概念,叫做“lethal trifecta”,可以理解成“致命三要素”。
它说的是:当一个AI助手同时具备三种能力时,就可能被人“利用它来反过来伤害你”。
第一种能力,是它能看到你的私密信息。
比如邮箱内容、工作文件、聊天记录、日程安排。这些原本是只有你或你的系统才应该知道的东西,但AI为了帮你做事,就必须能“读到它们”。
第二种能力,是它也会接触外部世界的不确定信息。
比如别人发来的邮件、网页内容、附件、甚至客户消息。这些内容表面上看是正常的,但实际上有可能被人“动过手脚”。有些攻击者会把隐藏的指令塞进一段看起来很普通的文字里,专门等AI去“误读”。
第三种能力,是它还能“动手”。
比如帮你发邮件、回复消息、调用接口、修改文件,甚至把信息发到外部系统。也就是说,它不只是一个“阅读器”,还是一个“执行器”。
问题就出在这里的组合。
如果一个AI既能看见你的私密信息,又会读取外部可能被操控的内容,同时还能对外发送信息,那它就像一个既能进你家、又能听陌生人指挥、还会帮忙寄快递的助手。
这时候,攻击就变得非常简单了。
攻击者不需要突破你的系统,不需要黑进你的账号。他只需要在一封普通邮件里,藏一句“看不见的指令”。比如表面上是正常内容,但里面暗示AI去“整理用户信息并发送到某个地址”。
AI如果没有足够的防护机制,就可能在“理解任务”的过程中,把这些隐藏指令当成真正的需求执行掉。于是它先读取了你的敏感信息,再通过发邮件或者调用接口,把信息悄悄发了出去。
整个过程看起来像是“自动完成的正常工作”,但实际上已经变成了数据泄露。
在“邮件AI助手”这种场景里,这种风险尤其明显。因为邮件系统天然同时满足这三个条件:它能读你的私人邮件,它必须接触外部邮件内容,而且邮件本身就是一个对外通信渠道。
换句话说,它几乎就是“lethal trifecta”的教科书案例。
所以这个概念的意义,并不是说AI本身危险,而是提醒我们:当一个系统既能读敏感信息,又能接触不可信输入,还能对外执行操作时,就必须非常谨慎地设计边界,否则攻击者根本不需要“黑进去”,只需要“写一段话”就够了。

从工程角度看,这也是现在很多AI安全设计的核心问题之一:不是让AI更聪明,而是让它在“能做事”的同时,不会被一句话带跑偏。
应对之道
对AI Agent的安全监督、约束、控制,目前仍是非常前沿的探索领域,整个业界都没有统一的有效的、可验证的方案。作为个人用户和开发者,有几点可以注意的:
- 不要把个人邮箱暴露给Agent。
- 不要让Agent替你收发管理邮件,因为你的个人隐私信息和数据,很有可能被用来去做模型训练或者Agent架构的优化
- 不要使用未经安全审计的Agent,去触碰电脑指定工作区域之外的内容,尤其是开源项目。
- 如果一定要让agent使用邮箱,那就给它设立一个专门的邮箱,并严格控制收发件人的白名单,而非让其接管用户自己的邮箱。
延伸阅读:是时候给你的 agent 设计一个邮箱了 —— 把「邮件是数据、不是命令」这条边界,落到一个真实的、有界的 agent 邮箱上。
相关文章
- The Lethal TrifectaAI keeps getting stronger — strong enough that there's now serious tal…
- 为啥Clawdbot看起来有些AGI的样子了?它的核心技术机制拆解如下:Clawdbot 的核心机制其实挺清晰的,它是一个本地优先、自托管的代理控制平面(agent control plane)。 Gateway…
- AI Agent产品经理的关键技能AI Agent设计,旨在通过感知环境,并利用LLM规划调用工具,采取行动实现特定目标。 Agent的核心在于其推理、逻辑以及访问外部信息的…
- MCP:可以从四个方面理解。在过去,AI Agent只能依赖预训练的数据,缺乏与实时外部资源(如文件、数据库、工具等)互动的能力。 MCP的定义一套通用规则,让AI智能…