Cloudflare Agent Memory — 让 Agent 记住一切

> 一句话版本：Cloudflare 发布了托管式 Agent Memory 服务。Agent 对话时自动提取记忆，需要时召回，compaction 时不再丢信息。直接提到支持 OpenClaw 作为 Agent 框架。私有 Beta。

项目	信息
来源	[blog.cloudflare.com/introducing-agent-memory](https://blog.cloudflare.com/introducing-agent-memory/)
发布日期	2026-04-17（今天）
作者	Tyson Trautmann, Rob Sutter
状态	🔒 私有 Beta
背景	Cloudflare Agents Week

核心问题

Agent 的记忆难题：context window 再大也有上限，context rot（上下文腐烂）是未解问题。

两个坏选择：

保留一切 → 质量下降（噪音太多）
激进裁剪 → 丢失重要信息

Agent Memory 的解法：提取 → 验证 → 分类 → 存储 → 按需召回，不塞满 context window。

API 设计


const profile = await env.MEMORY.getProfile("my-project");

// 批量摄取（compaction 时调用）
await profile.ingest([
  { role: "user", content: "用 React + TypeScript 搭项目" },
  { role: "assistant", content: "Done. 已搭建 Workers 项目" },
  { role: "user", content: "用 pnpm，不是 npm。默认深色模式" },
  { role: "assistant", content: "收到 -- pnpm + 深色模式" },
], { sessionId: "session-001" });

// 记住（模型主动存储重要信息）
await profile.remember({
  content: "API 限速在 4月10日 事件后提升到 10,000 req/s/zone",
  sessionId: "session-001",
});

// 召回（检索 + 合成答案）
const results = await profile.recall("用户偏好什么包管理器？");
// → "The user prefers pnpm over npm."

5 个操作：ingest / remember / recall / list / forget

记忆的生命周期

摄取管线（Ingestion Pipeline）

1. 确定性 ID 生成：SHA-256(session_id + role + content) → 128 bits，重复摄取幂等

2. 双路提取（并行）：

- Full pass：~10K 字符分块，2 条消息重叠，最多 4 块并发。生成结构化转录（角色标签 + 相对日期转绝对日期 + 来源行号）

- Detail pass（9+ 条消息时）：聚焦提取具体值（名称、价格、版本号、实体属性）

3. 8 项验证：实体身份、对象身份、位置上下文、时间准确性、组织上下文、完整性、关系上下文、推断事实是否有源支持

4. 4 类分类：

- Facts（事实）：当前为真，原子化，稳定（"项目用 GraphQL"）

- Events（事件）：特定时间发生的事（部署、决策）

- Instructions（指令）：如何做某事（流程、runbook）

- Tasks（任务）：正在做的事，设计为临时的

Supersession（替代）机制

Facts 和 Instructions 有 normalized topic key。新记忆与旧记忆同 key 时，旧记忆被替代而非删除——创建版本链，旧记忆指向前记忆。这样保留了历史。

Tasks 设计为临时的，过期后自动排除。

集成方式

Compaction 时自动摄取

Agent 的 context 生命周期关键节点是 compaction（上下文压缩）：

传统做法：compaction 时永久丢弃信息
Agent Memory：compaction 时摄取到记忆库

模型直接工具调用

模型获得 constrained API：

recall — 搜索记忆
remember — 主动存储
forget — 标记过时
list — 查看已有记忆

关键设计决策：不让模型设计查询或管理存储策略——constrained API 保持记忆逻辑在 Agent 主循环之外。

Agents SDK 集成

Agent Memory 是 Agents SDK Sessions API 中 memory 部分的参考实现。

REST API

非 Workers 环境也能用 REST API 访问（和 Cloudflare 其他 API 一样的模式）。

适用场景

1. 单 Agent 记忆

> "无论你用 Claude Code、OpenCode 等有 Human-in-the-loop 的 coding agent，还是 OpenClaw、Hermes 等自托管 Agent 框架，Agent Memory 都可以作为持久记忆层，无需修改 Agent 核心循环。"

Cloudflare 直接点名了 OpenClaw 和 Hermes。

2. 自定义 Agent Harness

后台 Agent（无 Human-in-the-loop）——Ramp Inspect、Stripe Minions、Spotify 后台编码 Agent 等。

3. 跨 Agent / 跨人 / 跨工具共享记忆

一个团队共享一个 memory profile：

一个人的 coding agent 学到的知识，所有人可用
Code review bot 和 coding agent 共享记忆
Agent 积累的知识从临时状态变成持久团队资产

数据所有权

所有记忆可导出
Cloudflare 承诺：知识可以随时带走
"正确的信任建立方式是让离开变容易"

分析

和之前研究的记忆系统对比：

维度	Cloudflare Agent Memory	Hindsight	MemPalace	nowledge
类型	托管服务	开源库	开源库	开源 SaaS
摄取	自动（compaction 时）	自动	手动	自动
验证	8 项验证	❌	❌	❌
分类	4 类（Facts/Events/Instructions/Tasks）	❌	宫殿隐喻	❌
Supersession	✅ 版本链	❌	❌	❌
召回	检索 + 合成答案	检索	宫殿结构	检索
共享	✅ 跨 Agent/人/工具	❌	❌	❌
定价	未公布（Beta）	免费	免费	免费
LongMemEval	未测	91.4%	96.6%（有争议）	未测

Cloudflare 的差异化：

1. 8 项验证——目前唯一做记忆验证的系统

2. Supersession 机制——事实更新不丢失历史

3. 4 类分类——Facts/Events/Instructions/Tasks 的设计很实用

4. 跨 Agent 共享——团队级记忆，不只是单 Agent

5. 托管服务——零运维，但锁定 Cloudflare

局限性：

🔒 私有 Beta，还没公开
只在 Cloudflare Workers 上原生支持（REST API 待确认）
定价未知
没有公开 benchmark（LongMemEval 等）
锁定 Cloudflare 生态（虽然承诺可导出）

与 Jay 的关联

🔥 Cloudflare 直接提到 OpenClaw——Agent Memory 可以作为 OpenClaw 的持久记忆层
Jay 之前研究过 Hindsight（8.2K ⭐）、nowledge、MemPalace 等记忆系统
compaction 时自动摄取正是 OpenClaw 的使用模式——context 太长时 compact，compact 的内容现在可以存到 Agent Memory
跨 Agent 共享对 Jay 有价值——researcher agent 和其他 agent 共享记忆
8 项验证 + 4 类分类是目前最严谨的记忆系统设计
⚠️ 但目前是私有 Beta，需要申请

📚 交叉引用 — ☁️ Cloudflare 宇宙

本报告属于以下系列的一部分：

评分

维度	评分 (1-10)	说明
创新性	9	8 项验证 + Supersession + 4 类分类，设计独特
实用性	8	直接点名 OpenClaw/Hermes/Claude Code，集成路径清晰
技术深度	9	摄取管线设计非常精细，是目前最严谨的实现
可及性	4	私有 Beta，定价未知，锁定 Cloudflare
与 Jay 的关联	10	直接提到 OpenClaw，compaction 集成完美匹配
总分	8.0	Agent 记忆系统的新标杆，等公开