GBrain v2 — Skillify 方法论 + Minions 后台系统（重大更新）

> 一句话版本：Garry Tan（YC 总裁）的 AI Agent 大脑系统大更新。核心方法论从"调 prompt"转向"Skillify"——把 Agent 能力变成确定性工具 + 完整测试链。新增 Minions 后台任务系统替代 sub-agent，零 token 消耗、100% 成功率。10,227 stars。

项目	信息
来源	[github.com/garrytan/gbrain](https://github.com/garrytan/gbrain)
Stars	10,227	Forks	1,215
创建	2026-04-05	最后推送	2026-04-22
作者	Garry Tan（YC President & CEO）
运行时	Bun + PGLite（Postgres）

与之前的报告的变化

之前的报告（8.0 分）基于早期版本。现在 GBrain 已经完全重构：

维度	之前	现在
Stars	未记录	10,227
Skills	~10	26+
后台任务	无	Minions（替代 sub-agent）
方法论	未明确	Skillify（10 项检查清单）
搜索	向量搜索	混合搜索 + 知识图谱
数据库	未明确	PGLite（2 秒启动）
基准测试	无	BrainBench v1

核心方法论：Skillify

"the latent space builds the deterministic tool, then the deterministic tool constrains the latent space"

核心思想

传统 Agent 开发：写 prompt → 调 prompt → 再调 prompt → 不稳定。

Skillify 方法论：把 Agent 能力变成确定性工具，用测试保证质量。

10 项检查清单

一个功能"properly skilled"需要：

#	项目	说明
1	SKILL.md	技能文件，含 YAML frontmatter、触发器、契约、阶段
2	Code	确定性脚本（如果适用）
3	Unit tests	覆盖确定性逻辑的每个分支
4	Integration tests	测试真实端点，不只是内存模拟
5	LLM evals	质量用例（happy/edge/adversarial），防止 prompt 回归
6	Resolver trigger	RESOLVER.md 中的触发模式
7	Resolver trigger eval	测试触发模式正确路由到目标 skill
8	check-resolvable	可达性 + MECE + DRY 验证
9	E2E test	从用户输入到副作用的完整管道测试
10	Brain filing	如果写 brain 页面，目录必须在 brain/RESOLVER.md

反模式

❌ 代码没有 SKILL.md → Agent 永远找不到它
❌ SKILL.md 没有测试 → prompt 改动静默回归
❌ 测试重新实现生产代码 → 测试的 bug 捕捉不到生产的 bug
❌ 确定性逻辑放在 LLM 空间 → 应该是脚本
❌ LLM 判断放在确定性空间 → 应该是 eval

Minions 后台任务系统

核心洞察：确定性工作不应该用推理模型。

Minions vs Sub-agents

维度	Sub-agents (sessions_spawn)	Minions
延迟	>10,000ms（网关超时）	753ms
Token 成本	~$0.03/次	$0.00
成功率	0%（19 cron 负载下无法 spawn）	100%
内存	~80 MB	~2 MB
持久性	网关重启丢失	Postgres 持久化

何时用哪个


确定性（同输入 → 同步骤 → 同输出）→ Minions
判断力（输入需要评估或决策）→ Sub-agents

例子：

拉取帖子、解析 JSON、写 brain 页面 → Minions（确定性）
审查收件箱、评估会议优先级、决定是否回复 → Sub-agents（判断力）

生产验证

Garry 的个人部署：19 个 cron 任务，36 个月的社交媒体帖子（19,240 条），~15 分钟完成，$0.00。

26 个 Skills 全景

常驻（每条消息触发）

signal-detector — 并行 spawn 便宜模型，捕获原始思考和实体
brain-ops — 任何 brain 读/写前先查 brain

内容摄取

idea-ingest — 链接/文章/推文 → brain 页面 + 实体提取
media-ingest — 视频/音频/PDF/书籍/截图
meeting-ingestion — 会议记录 → brain 页面 + 参会者丰富

搜索与丰富

query — 3 层搜索 + 综合引用
enrich — 分层丰富（Tier 1/2/3）：1 次提及 → stub，3 次 → web 丰富，8 次/会议 → 完整管道
data-research — 结构化数据研究（YAML 配方）

运维

maintain — 过期页面、孤儿、死链、引用审计
daily-task-manager — P0-P3 任务生命周期
cron-scheduler — 交错调度、静默期、幂等性
minion-orchestrator — 后台任务编排（fan-out、深度/上限/超时）

元技能

skillify — 把原始代码变成完整 skill
skill-creator — 创建新 skill
testing — 验证所有 skill 的合规性
cross-modal-review — 第二模型质量门控

知识图谱

每次写入自动提取实体引用，创建类型化链接：


attended（参会）、works_at（就职）、invested_in（投资）、founded（创立）、advises（顾问）

零 LLM 调用，纯确定性。

基准测试（240 页 Opus 生成语料）：

Recall@5：83% → 95%（+12pt）
Precision@5：39% → 45%（+6pt）
Graph-only F1：86.6% vs grep 的 57.8%（+28.8pt）

分析

优势：

🔥 Skillify 方法论清晰——10 项检查清单，可操作、可自动化
🔥 Minions 解决真实痛点——确定性工作零 token、100% 成功率
🔥 知识图谱 + 向量搜索——混合搜索大幅提升召回率
🔥 自动升级实体丰富度——从 stub 到 full pipeline，无需人工干预
📊 生产验证——Garry 个人使用，19 cron、45,000 页 brain
🎯 30 分钟安装——Agent 自主完成，人类只需回答 API Key 问题

风险：

⚠️ 184 个 open issues——快速增长带来稳定性挑战
⚠️ Garry 特定工作流——YC 投资人场景（会议、社交、投资），通用性待验证
⚠️ Bun 生态——依赖 Bun 运行时，不是所有环境都支持
🟡 PGLite 限制——本地开发用 PGLite，生产用 Supabase，迁移可能有坑

与 Jay 的关联：

🔥 Skillify 方法论直接可用——OpenClaw 的 skill 系统可以采用 10 项检查清单
Minions 概念适用于 researcher agent——我们的 cron lint 是确定性工作，理论上应该用 Minions 而不是 sub-agent
知识图谱——OpenClaw 的 memory 系统可以借鉴实体链接
RESOLVER.md 模式——比 OpenClaw 的 skill 描述更结构化（触发器 + 反歧义规则）

📚 交叉引用 — 🧬 GBrain 三部曲

本报告属于以下系列的一部分：

评分

维度	评分 (1-10)	说明
设计质量	9	Skillify + Minions + 知识图谱，三位一体
实用性	8	30 分钟安装，Agent 自主完成
创新性	9	"latent space builds tool, tool constrains space"
生态	8	10,227 stars，快速增长
通用性	6	偏投资场景，通用性待验证
与 Jay 的关联	9	Skillify 方法论 + Minions 概念直接适用
总分	8.5	AI Agent 大脑系统的标杆