MiMo Code:将编程 Agent 扩展到长程任务 — 深度研究

> 来源: https://mimo.xiaomi.com/zh/blog/mimo-code-long-horizon

> 日期: 2026-06-10(发布于小米 MiMo 团队博客)

> 评级: ⭐⭐⭐⭐⭐ (强烈推荐,必读)

一句话版本

小米 MiMo 团队开源了一款终端编程 Agent(基于 OpenCode),通过三层机制——并行采样降低单步错误率、Checkpoint 写入器实现无限轮次连续执行、跨 session 记忆蒸馏——让 AI 编码助手能从头到尾完成几百步的复杂编程任务,且步数超过 200 步后胜率超过 Claude Code 15%。

核心内容

背景:在做什么?

MiMo Code 是小米 MiMo 团队基于 OpenCode 构建的终端编程 Agent,MIT 协议开源。和 Claude Code、Codex 是直接竞品,但专注解决长程任务(几十到上百步)的质量保持问题。

博客深刻剖析了三个核心挑战:

时间尺度瓶颈解决方案
同 session 单轮决策质量取决于**计算量**Max Mode(并行采样选优)、Goal(完成度验证)
同 session 多轮任务连续性取决于**状态管理**Cycle/Checkpoint/Writer 四层记忆
跨 session经验提炼取决于**进化机制**Dream(7天整理)/ Distill(30天固化)

🧮 计算:降低每一步的犯错概率

Max Mode:每轮并行采样 5 个候选方案(不执行),同模型 judge 选最优

Goal:Agent 尝试终止时,独立验证模型审查历史判断条件是否满足

Dynamic Workflow:编排逻辑从 prompt 变成 JavaScript 代码,确定性执行

🧠 记忆:无限轮次的秘密

这是全文最硬核的部分。

Cycle 机制:运行时在 20%/45%/70% 上下文预算处触发 checkpoint,派出独立 writer subagent 将结构化状态写入磁盘。窗口即将耗尽时执行 rebuild,用持久化文件重建新窗口。理论上连接逻辑 session 可以无限延伸。

Writer:和主 Agent 完全独立的 subagent,写固定结构的 checkpoint 文件(11 个字段)。主 Agent 不维护自己的记忆,只有一个例外:notes.md(自由 scratchpad)。

四层记忆架构


Writer 向上提炼 ─────────────────────────┐
                                          ▼
  ┌─────────────┐    ┌──────────────┐    ┌──────────────┐    ┌───────────┐
  │  Session    │ →  │  Project     │ →  │  Global      │    │  History  │
  │ (checkpoint)│    │ (MEMORY.md)  │    │ (prefs)      │    │ (SQLite)  │
  └─────────────┘    └──────────────┘    └──────────────┘    └───────────┘
  当前 session         跨 session 知识      用户偏好            原始轨迹
  完整工作状态          架构决定/用户规则    跨项目生效          兜底回溯

选择文件(Markdown)而非向量数据库的核心原因:可审查性。用户能看到系统记住了什么,能手动删除或修改。

Rebuild 注入:最多约 65K token,分层组装:

任务清单 → session checkpoint → 最近用户消息切片 → 项目记忆 → 全局记忆 → notes → 文件路径索引 → tail reminder

🌱 进化:从经验中学习

📊 评测结果

评测结果
SWE-Bench Pro62% (MiMo + V2.5-Pro 优于 Claude Code + Sonnet 4.6)
Terminal Bench 273%
真人 AB 测试576 开发者 / 474 仓库 / 1213 配对
200步以内胜率接近 50%
超过 200 步MiMo Code 胜率 65%+

分析

📌 与我们的项目的直接关联

1. 记忆架构 vs lossless-claw

MiMo Code 的 Cycle/Checkpoint/Writer 体系与 lossless-claw 解决的是同一个问题——长上下文记忆,但走的是不同路线:

lossless-clawMiMo Code
提取主体运行时自动触发(不可见)独立 writer subagent
存储格式DAG 摘要节点结构化 checkpoint 文件(11 字段)
生命周期自动压缩四层升级(session→project→global→history)
可审查性通过 LCM 工具直接编辑 Markdown 文件
提取时机每次 compact20%/45%/70% 预算处

2. Dynamic Workflow vs SKILL.md

MiMo Code 明确指出"以 prompt 形式定义的许多 skill,未来会逐步演变为代码形式的 workflow 脚本"。这和 AGENTS.md + SKILL.md 的模式形成对比:

3. Dream/Distill → 知识库自维护

MiMo Code 的 7 天/30 天自动整理机制对知识库维护有启发——如果能定期自动扫描过期内容、去重合并、提取工作模式,可以大幅降低手动维护成本。

4. 与上次 MiMo UltraSpeed 研究的关联

上次报告(6月9日)关注的是 MiMo-V2.5 模型的推理速度(1T 模型 1000+ tps),这次是 MiMo Code 这个客户端应用。两者构成了完整的生态:高速推理模型 + 长程 Agent 框架。

✅ 优势

⚠️ 不足/风险

评分

维度评分说明
技术创新⭐⭐⭐⭐⭐Cycle + Checkpoint + Writer 架构设计精妙
工程实现⭐⭐⭐⭐⭐四层记忆、Dynamic Workflow、独立验证器
文档质量⭐⭐⭐⭐⭐博客文章本身就深度极高,技术决策有详细理由
对我们价值⭐⭐⭐⭐⭐记忆管理、Dynamic Workflow、进化机制直击我们正在解决的问题
项目活跃度⭐⭐⭐⭐刚发布,57 issues,社区活跃
基准测试⭐⭐⭐⭐⭐离线 + 真人双盲 AB 测试,业界顶级

总评:⭐⭐⭐⭐⭐(强烈推荐,必读)

链接