Agent-side Simulation 技术解读:执行前预测 Agent 行为的防御范式

2026-06-21 20:00:00

Agent-side Simulation 架构

问题

传统安全工具 看不到 Agent 实时决策

  • Agent 权限 跨系统、跨角色
  • 授权内恶意 行为(Agentjacking)不触发 常规告警

方案

Agent 意图 → Simulation 引擎 → 预测行为树
                    ↓ 风险?
              拦截 + Full Trace
                    ↓ 安全
              允许执行

vs 传统方案

方案 时机 局限
SIEM/日志 事后 Agent 决策 不可见
Prompt 过滤 输入 无法防 间接注入
Agent-side Sim 执行前 行为模型 训练

部署案例

  • 2→20 Agent 六个月扩张企业
  • 拦截 XSS 关键尝试
  • 捕获 Token 成本失控 runaway Agent

架构师视角

2026 Agent 安全栈 应包含:

  1. Ingress 过滤(Prompt/富文本)
  2. Agent-side Simulation(执行前)
  3. Egress 控制(网络/Tool 白名单)
  4. Trace + IAM(审计)

与 DeepMind TRAIT&R 任务级权限 互补