Claude Managed Agents 更新:Dreaming、Outcomes、Multiagent Orchestration
来源: https://claude.com/blog/new-in-claude-managed-agents
日期: 2026-05-06
评分: ⭐⭐⭐⭐⭐ (5/5 — Anthropic 平台的核心更新,直接定义 agent 平台竞争格局)
关联报告: Anthropic Claude Managed Agents "Dreaming" 功能深度解读(含 API 文档、技术参数、Python 示例)
一句话版本
Anthropic 在 2026 年 5 月的 "Code with Claude" 开发者大会上宣布了三项重大更新:Agent 可以在运行间隙"做梦"(Dreaming)来自我改进、可以用评分表(Outcomes)自我检查质量、还可以让多个 Agent 协同工作(Multiagent Orchestration)处理复杂任务。
核心内容
1. Dreaming(研究预览)
是什么: 一个定时运行的后台进程,回顾 Agent 的历史会话和记忆存储,提取模式并整理记忆,让 Agent 在多次运行之间自我改进。
关键特性:
- 跨会话模式发现:发现单个 Agent 无法看到的模式——重复性错误、团队共有的工作流偏好、Agent 共同收敛到的工作方式
- 记忆整理:重构记忆结构,保持高信噪比
- 自主或人工审核模式:可以选择让 Dreaming 自动更新记忆,也可以人工审核后再应用
- 适用场景:长期运行的项目、多 Agent 协作场景
工作原理:
Agent 运行中 → 记忆通过 Memory 功能实时记录
↓
Dreaming(定时触发)
↓
跨会话扫描 → 提取模式 → 整理记忆
↓
自动更新 / 人工审核
状态: 研究预览(需要申请访问权限)
2. Outcomes(公开 Beta)
是什么: 让 Agent 按照你编写的评分标准自我检查输出质量,不达标就重做。
关键特性:
- 独立评分器:用独立的上下文窗口评估 Agent 输出,不受 Agent 推理过程影响
- 自我纠错循环:评分器指出不足 → Agent 重做 → 再次评分 → 直到达标
- Webhook 通知:任务完成时自动通知
- 适用场景:品牌调性检查、格式规范、设计规范、测试覆盖率等
性能数据:
- 任务成功率提升最高 +10 个点(最难的问题提升最大)
- docx 文件生成质量 +8.4%
- pptx 文件生成质量 +10.1%
3. Multiagent Orchestration(公开 Beta)
是什么: 一个主 Agent 将复杂任务拆解,委派给多个专业子 Agent 并行执行。
关键特性:
- 专业分工:每个子 Agent 可以有自己的模型、提示词和工具
- 并行执行:子 Agent 在共享文件系统上并行工作
- 可追溯:Claude Console 完整记录谁做了什么、什么顺序、为什么
- 中断恢复:事件持久化,Agent 记住已完成的工作
示例架构:
主 Agent(拆分任务)
├── Agent A:分析部署历史
├── Agent B:检查错误日志
├── Agent C:扫描指标
└── Agent D:查询工单系统
实际案例
| 团队 | 用途 | 使用功能 | 效果 |
|---|---|---|---|
| **Harvey**(法律 AI) | 长文档起草、法律文书 | Dreaming | 完成率提升 ~6x |
| **Netflix** 平台团队 | 构建分析 Agent | Multiagent | 从数百个构建日志中并行发现模式 |
| **Spiral**(by Every) | 写作 Agent API | Multiagent + Outcomes | Haiku 主控 + Opus 起草,用评分确保质量 |
| **Wisedocs** | 文档质量审核 | Outcomes | 审核速度提升 50% |
Spiral 架构亮点
Spiral 的设计很有参考价值——主 Agent 跑在 Haiku(快、便宜),负责接收请求和追问;然后委派给跑在 Opus(强、慢)的子 Agent 进行实际起草。多个草稿并行生成,每个都通过 Outcomes 评分,只有达到质量标准才返回给用户。
这种"轻薄主控 + 重型执行者"的模式,和我们在 OpenClaw 里做 sub-agent dispatch 的思路非常像。
背景分析
与我们的项目关联
1. Dreaming ≈ OpenClaw 的 lossless-claw + 记忆系统:我们已经在做类似的事情——lossless-claw 的摘要 DAG + 心跳机制其实就是"做梦"的雏形。Anthropic 做的是把这个过程产品化、定时化。值得关注的是他们的"跨 Agent 模式发现"和"记忆整理"策略。
2. Outcomes 验证了我们关于"自我纠错循环"的判断:我们之前在 agent 设计里讨论过"让 agent 用独立上下文窗口评估自己的输出",Outcomes 就是把这个模式做成平台级功能了。
3. Multiagent Orchestration 是 agent 平台的必然方向:平台层面支持 task splitting + parallel sub-agents,这和我们用 sessions_spawn + sub-agents 做的事同构。
竞争格局
- OpenAI 的 Agents SDK、Assistants API 也有类似 multi-agent 能力,但没有"做梦"这种跨会话记忆优化
- Google (Vertex AI Agent Builder) 有 agent 编排,但记忆模块较弱
- Anthropic 这波更新的核心差异化:Memory + Dreaming 构成完整的学习闭环——运行中实时记忆(Memory)+ 运行间隔回顾优化(Dreaming)
注意事项
- Dreaming 目前是研究预览,需申请访问
- Outcomes 和 Multiagent Orchestration 是公开 Beta,可以开始用
- 同时宣布的还有 Pro/Max 套餐 5 小时使用限制翻倍(应对算力压力)
评分
| 维度 | 评分 | 说明 |
|---|---|---|
| 创新性 | ⭐⭐⭐⭐⭐ | Dreaming 概念新颖,将 agent 记忆管理产品化 |
| 实用性 | ⭐⭐⭐⭐⭐ | 直接解决 agent 长期运行的痛点 |
| 文档质量 | ⭐⭐⭐⭐⭐ | Anthropic 一贯的高质量文档 |
| 生态影响 | ⭐⭐⭐⭐☆ | 需观察能吸引多少开发者使用 Managed Agents |
| 与我们的关联 | ⭐⭐⭐⭐⭐ | 直接验证并启发我们的架构方向 |
综合:5/5 — 这是 Anthropic 平台策略的重要一步,Agent 正从"单次执行工具"进化到"持续自我改进的系统"。