Smart Host Dumb Sandbox

Smart Host Dumb Sandbox

智能主机、简单沙盒（Smart Host, Dumb Sandbox）是一种 Cloud Agent Runtime 架构原则：把身份、密钥、计费、持久化、策略和可观察性放在可信主机里，把模型选择的代码执行放进可丢弃的沙盒里。

核心分工

Agent Host Control Plane 是可信、长寿命的控制平面，负责用户身份、长期凭证、业务状态、计费决策、重试、策略检查和系统记录。

Agent Sandbox 是不可信执行边界，负责运行模型生成或选择的代码、shell 命令、辅助脚本和本地工具。它可以产生文件和结构化事件，再交给主机判断如何保存或转发。

Agent Tool Bridge 是两者之间的窄通道。沙盒发起请求，主机检查当前运行、策略和授权，再在服务端附加真实凭证并记录边界跨越。

设计测试

这个模式用失败场景校验架构边界：

提示注入（Prompt Injection）诱导智能体导出环境时，攻击者只能拿到单次运行、短时间窗口和特定作用域内的凭证。
沙盒崩溃时，临时文件和进行中执行可能丢失，用户身份、计费状态、持久事件日志、重试能力和解释能力仍由主机保留。
新功能需要密钥、持久状态、授权判断或内部服务调用时，应归入主机或桥接层；模型选择代码执行才归入沙盒。

为什么重要

云智能体可能在共享基础设施上无人值守运行，也可能由定时任务、API 或其他智能体触发。此时沙盒内代码来自 LLM 输出，提示词可能带有对抗性，执行环境也可能已经被攻陷。

智能主机、简单沙盒模式让高权限能力远离可攻陷执行环境，降低 Agent Loop 中工具调用和代码执行的 blast radius，并为 Slow AI 的重试、恢复、回执和审计提供系统基础。

相关概念

Backlinks

References

Dumb Sandbox, Smart Host