Agent-side Simulation 技术解读:执行前预测 Agent 行为的防御范式
2026-06-21 20:00:00
Agent-side Simulation 架构
问题
传统安全工具 看不到 Agent 实时决策:
- Agent 权限 跨系统、跨角色
- 授权内恶意 行为(Agentjacking)不触发 常规告警
方案
Agent 意图 → Simulation 引擎 → 预测行为树
↓ 风险?
拦截 + Full Trace
↓ 安全
允许执行
vs 传统方案
| 方案 | 时机 | 局限 |
|---|---|---|
| SIEM/日志 | 事后 | Agent 决策 不可见 |
| Prompt 过滤 | 输入 | 无法防 间接注入 |
| Agent-side Sim | 执行前 | 需 行为模型 训练 |
部署案例
- 2→20 Agent 六个月扩张企业
- 拦截 XSS 关键尝试
- 捕获 Token 成本失控 runaway Agent
架构师视角
2026 Agent 安全栈 应包含:
- Ingress 过滤(Prompt/富文本)
- Agent-side Simulation(执行前)
- Egress 控制(网络/Tool 白名单)
- Trace + IAM(审计)
与 DeepMind TRAIT&R 任务级权限 互补。