Cloudflare Agent Memory — 让 Agent 记住一切

> 一句话版本:Cloudflare 发布了托管式 Agent Memory 服务。Agent 对话时自动提取记忆,需要时召回,compaction 时不再丢信息。直接提到支持 OpenClaw 作为 Agent 框架。私有 Beta。

项目信息
来源[blog.cloudflare.com/introducing-agent-memory](https://blog.cloudflare.com/introducing-agent-memory/)
发布日期2026-04-17(今天)
作者Tyson Trautmann, Rob Sutter
状态🔒 私有 Beta
背景Cloudflare Agents Week

核心问题

Agent 的记忆难题:context window 再大也有上限,context rot(上下文腐烂)是未解问题。

两个坏选择:

Agent Memory 的解法:提取 → 验证 → 分类 → 存储 → 按需召回,不塞满 context window。

API 设计


const profile = await env.MEMORY.getProfile("my-project");

// 批量摄取(compaction 时调用)
await profile.ingest([
  { role: "user", content: "用 React + TypeScript 搭项目" },
  { role: "assistant", content: "Done. 已搭建 Workers 项目" },
  { role: "user", content: "用 pnpm,不是 npm。默认深色模式" },
  { role: "assistant", content: "收到 -- pnpm + 深色模式" },
], { sessionId: "session-001" });

// 记住(模型主动存储重要信息)
await profile.remember({
  content: "API 限速在 4月10日 事件后提升到 10,000 req/s/zone",
  sessionId: "session-001",
});

// 召回(检索 + 合成答案)
const results = await profile.recall("用户偏好什么包管理器?");
// → "The user prefers pnpm over npm."

5 个操作:ingest / remember / recall / list / forget

记忆的生命周期

摄取管线(Ingestion Pipeline)

1. 确定性 ID 生成:SHA-256(session_id + role + content) → 128 bits,重复摄取幂等

2. 双路提取(并行):

- Full pass:~10K 字符分块,2 条消息重叠,最多 4 块并发。生成结构化转录(角色标签 + 相对日期转绝对日期 + 来源行号)

- Detail pass(9+ 条消息时):聚焦提取具体值(名称、价格、版本号、实体属性)

3. 8 项验证:实体身份、对象身份、位置上下文、时间准确性、组织上下文、完整性、关系上下文、推断事实是否有源支持

4. 4 类分类

- Facts(事实):当前为真,原子化,稳定("项目用 GraphQL")

- Events(事件):特定时间发生的事(部署、决策)

- Instructions(指令):如何做某事(流程、runbook)

- Tasks(任务):正在做的事,设计为临时的

Supersession(替代)机制

Facts 和 Instructions 有 normalized topic key。新记忆与旧记忆同 key 时,旧记忆被替代而非删除——创建版本链,旧记忆指向前记忆。这样保留了历史。

Tasks 设计为临时的,过期后自动排除。

集成方式

Compaction 时自动摄取

Agent 的 context 生命周期关键节点是 compaction(上下文压缩):

模型直接工具调用

模型获得 constrained API:

关键设计决策:不让模型设计查询或管理存储策略——constrained API 保持记忆逻辑在 Agent 主循环之外。

Agents SDK 集成

Agent Memory 是 Agents SDK Sessions API 中 memory 部分的参考实现

REST API

非 Workers 环境也能用 REST API 访问(和 Cloudflare 其他 API 一样的模式)。

适用场景

1. 单 Agent 记忆

> "无论你用 Claude Code、OpenCode 等有 Human-in-the-loop 的 coding agent,还是 OpenClaw、Hermes 等自托管 Agent 框架,Agent Memory 都可以作为持久记忆层,无需修改 Agent 核心循环。"

Cloudflare 直接点名了 OpenClaw 和 Hermes。

2. 自定义 Agent Harness

后台 Agent(无 Human-in-the-loop)——Ramp Inspect、Stripe Minions、Spotify 后台编码 Agent 等。

3. 跨 Agent / 跨人 / 跨工具共享记忆

一个团队共享一个 memory profile:

数据所有权

分析

和之前研究的记忆系统对比

维度Cloudflare Agent MemoryHindsightMemPalacenowledge
类型托管服务开源库开源库开源 SaaS
摄取自动(compaction 时)自动手动自动
验证8 项验证
分类4 类(Facts/Events/Instructions/Tasks)宫殿隐喻
Supersession✅ 版本链
召回检索 + 合成答案检索宫殿结构检索
共享✅ 跨 Agent/人/工具
定价未公布(Beta)免费免费免费
LongMemEval未测91.4%96.6%(有争议)未测

Cloudflare 的差异化

1. 8 项验证——目前唯一做记忆验证的系统

2. Supersession 机制——事实更新不丢失历史

3. 4 类分类——Facts/Events/Instructions/Tasks 的设计很实用

4. 跨 Agent 共享——团队级记忆,不只是单 Agent

5. 托管服务——零运维,但锁定 Cloudflare

局限性

与 Jay 的关联

评分

维度评分 (1-10)说明
创新性98 项验证 + Supersession + 4 类分类,设计独特
实用性8直接点名 OpenClaw/Hermes/Claude Code,集成路径清晰
技术深度9摄取管线设计非常精细,是目前最严谨的实现
可及性4私有 Beta,定价未知,锁定 Cloudflare
与 Jay 的关联10直接提到 OpenClaw,compaction 集成完美匹配
**总分****8.0**Agent 记忆系统的新标杆,等公开