Claude Managed Agents 更新：Dreaming、Outcomes、Multiagent Orchestration

来源： https://claude.com/blog/new-in-claude-managed-agents

日期： 2026-05-06

评分： ⭐⭐⭐⭐⭐ (5/5 — Anthropic 平台的核心更新，直接定义 agent 平台竞争格局)

关联报告： Anthropic Claude Managed Agents "Dreaming" 功能深度解读（含 API 文档、技术参数、Python 示例）

一句话版本

Anthropic 在 2026 年 5 月的 "Code with Claude" 开发者大会上宣布了三项重大更新：Agent 可以在运行间隙"做梦"（Dreaming）来自我改进、可以用评分表（Outcomes）自我检查质量、还可以让多个 Agent 协同工作（Multiagent Orchestration）处理复杂任务。

核心内容

1. Dreaming（研究预览）

是什么： 一个定时运行的后台进程，回顾 Agent 的历史会话和记忆存储，提取模式并整理记忆，让 Agent 在多次运行之间自我改进。

关键特性：

跨会话模式发现：发现单个 Agent 无法看到的模式——重复性错误、团队共有的工作流偏好、Agent 共同收敛到的工作方式
记忆整理：重构记忆结构，保持高信噪比
自主或人工审核模式：可以选择让 Dreaming 自动更新记忆，也可以人工审核后再应用
适用场景：长期运行的项目、多 Agent 协作场景

工作原理：


Agent 运行中 → 记忆通过 Memory 功能实时记录
              ↓
        Dreaming（定时触发）
              ↓
        跨会话扫描 → 提取模式 → 整理记忆
              ↓
        自动更新 / 人工审核

状态： 研究预览（需要申请访问权限）

2. Outcomes（公开 Beta）

是什么： 让 Agent 按照你编写的评分标准自我检查输出质量，不达标就重做。

关键特性：

独立评分器：用独立的上下文窗口评估 Agent 输出，不受 Agent 推理过程影响
自我纠错循环：评分器指出不足 → Agent 重做 → 再次评分 → 直到达标
Webhook 通知：任务完成时自动通知
适用场景：品牌调性检查、格式规范、设计规范、测试覆盖率等

性能数据：

任务成功率提升最高 +10 个点（最难的问题提升最大）
docx 文件生成质量 +8.4%
pptx 文件生成质量 +10.1%

3. Multiagent Orchestration（公开 Beta）

是什么： 一个主 Agent 将复杂任务拆解，委派给多个专业子 Agent 并行执行。

关键特性：

专业分工：每个子 Agent 可以有自己的模型、提示词和工具
并行执行：子 Agent 在共享文件系统上并行工作
可追溯：Claude Console 完整记录谁做了什么、什么顺序、为什么
中断恢复：事件持久化，Agent 记住已完成的工作

示例架构：


主 Agent（拆分任务）
  ├── Agent A：分析部署历史
  ├── Agent B：检查错误日志
  ├── Agent C：扫描指标
  └── Agent D：查询工单系统

实际案例

团队	用途	使用功能	效果
Harvey（法律 AI）	长文档起草、法律文书	Dreaming	完成率提升 ~6x
Netflix 平台团队	构建分析 Agent	Multiagent	从数百个构建日志中并行发现模式
Spiral（by Every）	写作 Agent API	Multiagent + Outcomes	Haiku 主控 + Opus 起草，用评分确保质量
Wisedocs	文档质量审核	Outcomes	审核速度提升 50%

Spiral 架构亮点

Spiral 的设计很有参考价值——主 Agent 跑在 Haiku（快、便宜），负责接收请求和追问；然后委派给跑在 Opus（强、慢）的子 Agent 进行实际起草。多个草稿并行生成，每个都通过 Outcomes 评分，只有达到质量标准才返回给用户。

这种"轻薄主控 + 重型执行者"的模式，和我们在 OpenClaw 里做 sub-agent dispatch 的思路非常像。

背景分析

与我们的项目关联

1. Dreaming ≈ OpenClaw 的 lossless-claw + 记忆系统：我们已经在做类似的事情——lossless-claw 的摘要 DAG + 心跳机制其实就是"做梦"的雏形。Anthropic 做的是把这个过程产品化、定时化。值得关注的是他们的"跨 Agent 模式发现"和"记忆整理"策略。

2. Outcomes 验证了我们关于"自我纠错循环"的判断：我们之前在 agent 设计里讨论过"让 agent 用独立上下文窗口评估自己的输出"，Outcomes 就是把这个模式做成平台级功能了。

3. Multiagent Orchestration 是 agent 平台的必然方向：平台层面支持 task splitting + parallel sub-agents，这和我们用 sessions_spawn + sub-agents 做的事同构。

竞争格局

OpenAI 的 Agents SDK、Assistants API 也有类似 multi-agent 能力，但没有"做梦"这种跨会话记忆优化
Google (Vertex AI Agent Builder) 有 agent 编排，但记忆模块较弱
Anthropic 这波更新的核心差异化：Memory + Dreaming 构成完整的学习闭环——运行中实时记忆（Memory）+ 运行间隔回顾优化（Dreaming）

注意事项

Dreaming 目前是研究预览，需申请访问
Outcomes 和 Multiagent Orchestration 是公开 Beta，可以开始用
同时宣布的还有 Pro/Max 套餐 5 小时使用限制翻倍（应对算力压力）

评分

维度	评分	说明
创新性	⭐⭐⭐⭐⭐	Dreaming 概念新颖，将 agent 记忆管理产品化
实用性	⭐⭐⭐⭐⭐	直接解决 agent 长期运行的痛点
文档质量	⭐⭐⭐⭐⭐	Anthropic 一贯的高质量文档
生态影响	⭐⭐⭐⭐☆	需观察能吸引多少开发者使用 Managed Agents
与我们的关联	⭐⭐⭐⭐⭐	直接验证并启发我们的架构方向

综合：5/5 — 这是 Anthropic 平台策略的重要一步，Agent 正从"单次执行工具"进化到"持续自我改进的系统"。