人工智能代理的最小权限原则：单一身份，单一作用域

一个团队在周五发布了一个支持工单分类代理。它在两周内运行良好——读取收件邮件、起草回复、创建工单。随后，一次提示词回归漏洞随部署溜入生产环境，导致该代理错误分类了一个邮件线程，并开始对所见的一切内容进行回复。数小时内无人察觉，因为该代理使用的凭证与整个平台共用，其邮箱与其他三个机器人共享，且没有针对单个代理的配额限制来触发警报。事后分析报告的第一句话写道：我们无法区分哪个代理执行了哪些操作，也没有任何机制能够阻止它们中的任何一个。

这并非大语言模型的问题。这是一个访问控制问题，而解决方案则是安全领域最古老的理念：最小权限原则——即每个代理拥有独立的身份、独立的作用域以及独立的配额。

事件背后的模式

代理集群往往从单一的概念验证项目发展而来，而概念验证阶段的临时捷径逐渐固化为架构：一个拥有完全访问权限的应用程序接口密钥、多个代理共享的一个邮箱、仅存在于系统提示词中的能力边界。每一个捷径都扩大了故障影响范围。奈拉斯人工智能代理安全指南对第一点直言不讳——应用程序接口密钥授予对所有连接账户的完全访问权限，因此应像对待数据库根密码一样对待它，将其保存在秘密管理器中，绝不要放在代码或任何可能被记录日志的提示词上下文中。

邮箱共享这一捷径则更为隐蔽。每次奈拉斯应用程序接口调用都限定于特定的授权范围，代理只能访问其持有标识符的授权数据。这种范围限定提供了免费的隔离性——但前提是每个代理都拥有自己的授权。如果共享同一个授权，你就将所有代理的读取权限、发送历史记录和故障模式合并到了一个池中。

使访问权限与任务相匹配

在配置任何资源之前，先写下每个代理实际执行的任务，然后仅授予相应的权限：

如果代理...	它需要...
总结收件箱内容	仅读取电子邮件——无发送、无删除权限
安排会议	读取日历、创建事件——无电子邮件访问权限
起草供审核的回复	仅创建草稿——由人类点击发送
充当全能助手	读/写权限——需发送确认

在两个层面强制执行此策略：系统提示词（设定意图但可能被颠覆）和工具表面（不可被颠覆）。如果你正在使用模型上下文协议，请仅启用代理所需的工具——一个没有发送工具的总结器无法通过提示词注入被诱骗发送消息。

用策略而非承诺来强制执行限制

系统提示词仅是指导；策略才是强制手段。对于代理账户（目前处于测试阶段），策略、规则和列表将边界完全移出了模型的控制范围。策略捆绑了一系列限制——每日发送配额、存储上限、附件大小和数量、保留窗口期——以及带有 spam_sensitivity 调节旋钮的垃圾邮件检测功能，该旋钮的范围从 0.1 到 5.0。所有限制都是可选的，默认值为你所在套餐的最大值，因此你只需指定希望更严格限制的方面：

curl --request POST \
  --url "https://api.us.nylas.com/v3/policies" \
  --header "Authorization: Bearer $NYLAS_API_KEY" \免责声明：本文内容来自互联网，该文观点不代表本站观点。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请到页面底部单击反馈，一经查实，本站将立刻删除。