GBrain v2 — Skillify 方法论 + Minions 后台系统(重大更新)
> 一句话版本:Garry Tan(YC 总裁)的 AI Agent 大脑系统大更新。核心方法论从"调 prompt"转向"Skillify"——把 Agent 能力变成确定性工具 + 完整测试链。新增 Minions 后台任务系统替代 sub-agent,零 token 消耗、100% 成功率。10,227 stars。
| 项目 | 信息 | ||
|---|---|---|---|
| 来源 | [github.com/garrytan/gbrain](https://github.com/garrytan/gbrain) | ||
| Stars | 10,227 | Forks | 1,215 |
| 创建 | 2026-04-05 | 最后推送 | 2026-04-22 |
| 作者 | Garry Tan(YC President & CEO) | ||
| 运行时 | Bun + PGLite(Postgres) |
与之前的报告的变化
之前的报告(8.0 分)基于早期版本。现在 GBrain 已经完全重构:
| 维度 | 之前 | 现在 |
|---|---|---|
| Stars | 未记录 | 10,227 |
| Skills | ~10 | 26+ |
| 后台任务 | 无 | Minions(替代 sub-agent) |
| 方法论 | 未明确 | Skillify(10 项检查清单) |
| 搜索 | 向量搜索 | 混合搜索 + 知识图谱 |
| 数据库 | 未明确 | PGLite(2 秒启动) |
| 基准测试 | 无 | BrainBench v1 |
核心方法论:Skillify
"the latent space builds the deterministic tool, then the deterministic tool constrains the latent space"
核心思想
传统 Agent 开发:写 prompt → 调 prompt → 再调 prompt → 不稳定。
Skillify 方法论:把 Agent 能力变成确定性工具,用测试保证质量。
10 项检查清单
一个功能"properly skilled"需要:
| # | 项目 | 说明 |
|---|---|---|
| 1 | **SKILL.md** | 技能文件,含 YAML frontmatter、触发器、契约、阶段 |
| 2 | **Code** | 确定性脚本(如果适用) |
| 3 | **Unit tests** | 覆盖确定性逻辑的每个分支 |
| 4 | **Integration tests** | 测试真实端点,不只是内存模拟 |
| 5 | **LLM evals** | 质量用例(happy/edge/adversarial),防止 prompt 回归 |
| 6 | **Resolver trigger** | RESOLVER.md 中的触发模式 |
| 7 | **Resolver trigger eval** | 测试触发模式正确路由到目标 skill |
| 8 | **check-resolvable** | 可达性 + MECE + DRY 验证 |
| 9 | **E2E test** | 从用户输入到副作用的完整管道测试 |
| 10 | **Brain filing** | 如果写 brain 页面,目录必须在 brain/RESOLVER.md |
反模式
- ❌ 代码没有 SKILL.md → Agent 永远找不到它
- ❌ SKILL.md 没有测试 → prompt 改动静默回归
- ❌ 测试重新实现生产代码 → 测试的 bug 捕捉不到生产的 bug
- ❌ 确定性逻辑放在 LLM 空间 → 应该是脚本
- ❌ LLM 判断放在确定性空间 → 应该是 eval
Minions 后台任务系统
核心洞察:确定性工作不应该用推理模型。
Minions vs Sub-agents
| 维度 | Sub-agents (sessions_spawn) | Minions |
|---|---|---|
| 延迟 | >10,000ms(网关超时) | 753ms |
| Token 成本 | ~$0.03/次 | $0.00 |
| 成功率 | 0%(19 cron 负载下无法 spawn) | 100% |
| 内存 | ~80 MB | ~2 MB |
| 持久性 | 网关重启丢失 | Postgres 持久化 |
何时用哪个
确定性(同输入 → 同步骤 → 同输出)→ Minions
判断力(输入需要评估或决策)→ Sub-agents
例子:
- 拉取帖子、解析 JSON、写 brain 页面 → Minions(确定性)
- 审查收件箱、评估会议优先级、决定是否回复 → Sub-agents(判断力)
生产验证
Garry 的个人部署:19 个 cron 任务,36 个月的社交媒体帖子(19,240 条),~15 分钟完成,$0.00。
26 个 Skills 全景
常驻(每条消息触发)
- signal-detector — 并行 spawn 便宜模型,捕获原始思考和实体
- brain-ops — 任何 brain 读/写前先查 brain
内容摄取
- idea-ingest — 链接/文章/推文 → brain 页面 + 实体提取
- media-ingest — 视频/音频/PDF/书籍/截图
- meeting-ingestion — 会议记录 → brain 页面 + 参会者丰富
搜索与丰富
- query — 3 层搜索 + 综合引用
- enrich — 分层丰富(Tier 1/2/3):1 次提及 → stub,3 次 → web 丰富,8 次/会议 → 完整管道
- data-research — 结构化数据研究(YAML 配方)
运维
- maintain — 过期页面、孤儿、死链、引用审计
- daily-task-manager — P0-P3 任务生命周期
- cron-scheduler — 交错调度、静默期、幂等性
- minion-orchestrator — 后台任务编排(fan-out、深度/上限/超时)
元技能
- skillify — 把原始代码变成完整 skill
- skill-creator — 创建新 skill
- testing — 验证所有 skill 的合规性
- cross-modal-review — 第二模型质量门控
知识图谱
每次写入自动提取实体引用,创建类型化链接:
attended(参会)、works_at(就职)、invested_in(投资)、founded(创立)、advises(顾问)
零 LLM 调用,纯确定性。
基准测试(240 页 Opus 生成语料):
- Recall@5:83% → 95%(+12pt)
- Precision@5:39% → 45%(+6pt)
- Graph-only F1:86.6% vs grep 的 57.8%(+28.8pt)
分析
优势:
- 🔥 Skillify 方法论清晰——10 项检查清单,可操作、可自动化
- 🔥 Minions 解决真实痛点——确定性工作零 token、100% 成功率
- 🔥 知识图谱 + 向量搜索——混合搜索大幅提升召回率
- 🔥 自动升级实体丰富度——从 stub 到 full pipeline,无需人工干预
- 📊 生产验证——Garry 个人使用,19 cron、45,000 页 brain
- 🎯 30 分钟安装——Agent 自主完成,人类只需回答 API Key 问题
风险:
- ⚠️ 184 个 open issues——快速增长带来稳定性挑战
- ⚠️ Garry 特定工作流——YC 投资人场景(会议、社交、投资),通用性待验证
- ⚠️ Bun 生态——依赖 Bun 运行时,不是所有环境都支持
- 🟡 PGLite 限制——本地开发用 PGLite,生产用 Supabase,迁移可能有坑
与 Jay 的关联:
- 🔥 Skillify 方法论直接可用——OpenClaw 的 skill 系统可以采用 10 项检查清单
- Minions 概念适用于 researcher agent——我们的 cron lint 是确定性工作,理论上应该用 Minions 而不是 sub-agent
- 知识图谱——OpenClaw 的 memory 系统可以借鉴实体链接
- RESOLVER.md 模式——比 OpenClaw 的 skill 描述更结构化(触发器 + 反歧义规则)
评分
| 维度 | 评分 (1-10) | 说明 |
|---|---|---|
| 设计质量 | 9 | Skillify + Minions + 知识图谱,三位一体 |
| 实用性 | 8 | 30 分钟安装,Agent 自主完成 |
| 创新性 | 9 | "latent space builds tool, tool constrains space" |
| 生态 | 8 | 10,227 stars,快速增长 |
| 通用性 | 6 | 偏投资场景,通用性待验证 |
| 与 Jay 的关联 | 9 | Skillify 方法论 + Minions 概念直接适用 |
| **总分** | **8.5** | AI Agent 大脑系统的标杆 |