gbrain — Garry Tan 的个人知识大脑
> 一句话版本:Y Combinator 总裁 Garry Tan 做的个人 AI 记忆系统,把你所有的会议、邮件、笔记、想法都变成可搜索的知识库,AI 助手越用越聪明,甚至你睡觉的时候它还在帮你整理记忆。
| 项目 | 信息 | |
|---|---|---|
| 来源 | https://github.com/garrytan/gbrain | |
| 作者 | Garry Tan(Y Combinator 总裁) | |
| 创建时间 | 2026-04-05 | |
| 语言 | TypeScript | |
| Stars | 1,730 | Forks 179 |
| 依赖 | Supabase($25/月)、OpenAI API、Anthropic API(可选) |
核心内容
gbrain 是 Garry Tan 为自己的 OpenClaw agent 打造的知识系统。灵感来自 Vannevar Bush 1945 年提出的 Memex 概念——一台"让人脑延伸的机器"。
真实数据规模
Garry 自己的生产部署:
| 数据 | 数量 |
|---|---|
| Markdown 文件 | 10,000+ |
| 人物档案 | 3,000+(含关系历史) |
| 日历数据 | 13 年 / 21,000+ 事件 |
| Apple Notes | 5,800+(回溯到 2009 年) |
| 会议记录 | 280+(AI 分析) |
| 原创想法 | 300+(按主题分类) |
| 媒体页面 | 500+(视频转录、书籍、文章) |
三层架构
┌──────────────────┐ ┌───────────────┐ ┌──────────────────┐
│ Brain Repo │ │ GBrain │ │ AI Agent │
│ (git) │→ │ (检索层) │←→│ (读写层) │
│ │ │ │ │ │
│ markdown 文件 │ │ Postgres + │ │ OpenClaw / │
│ = 真相来源 │ │ pgvector │ │ Hermes Agent │
│ │← │ │ │ │
│ 人类随时可编辑 │ │ 混合搜索 │ │ 实体检测、丰富 │
└──────────────────┘ │ (向量+关键词 │ │ 摄取、简报 │
│ + RRF 融合) │ │ │
└───────────────┘ └──────────────────┘
- Brain Repo:Git 仓库里的 Markdown 文件,人类可直接编辑
- GBrain:Postgres + pgvector 检索层,混合搜索
- AI Agent:通过 MCP 30 个工具读写知识库
知识模型:编译真相 + 时间线
每个知识页面的结构:
# Pedro(编译真相 — 你当前的最佳理解,证据变了就重写)
投资了 Brex、Notion,YC 校友,关注金融科技...
## 关系
- 与 Diana:2024年3月晚宴认识...
- 与 Jordan:共同投资了...
## 时间线(append-only — 证据链,永远不编辑)
- 2026-04-01:晚餐讨论了 AI 监管...
- 2026-03-15:介绍了 Brex 新产品...
- 2025-11-20:首次见面,YC 校友活动...
梦境循环(Dream Cycle)
最酷的功能——你睡觉时 agent 在"做梦":
1. 扫描当天所有对话
2. 检测新实体(人、公司、想法)
3. 丰富缺失的实体信息
4. 修复断裂的引用链接
5. 整合记忆
> "我睡觉的时候 agent 也在跑……字面意义上的。我醒来时大脑比睡前更聪明。"
核心循环
信号到达(会议/邮件/推文/链接)
→ Agent 检测实体(人/公司/想法)
→ 读:先查大脑(gbrain search)
→ 带完整上下文回复
→ 写:更新大脑页面
→ 同步:gbrain 索引变更
每次循环都增加知识。下次提到 Pedro,agent 已经知道他的角色、你们的历史、他关心什么、上次讨论了什么。永远不从零开始。
实际查询示例
- "我应该请谁吃饭,同时认识 Pedro 和 Diana?" → 跨 3000+ 人物页面交叉引用社交图谱
- "我关于羞耻感和创始人表现之间关系的看法是什么?" → 搜索你的思考,不是互联网
- "Series A 从周二以来有什么变化?" → 跨公司和交易页面 diff 时间线条目
- "帮我准备 30 分钟后和 Jordan 的会议" → 拉取档案、共同历史、近期活动、未完事项
搜索为什么不能只用 grep?
| 文件数 | grep | gbrain |
|---|---|---|
| 500 | ✅ 够用 | 杀鸡用牛刀 |
| 3,000 人物页 | ❌ 30 秒 | ✅ 毫秒级 |
| 5,800 Apple Notes | ❌ 爆了 | ✅ 增量索引 |
| 10,000+ 混合内容 | ❌ 不可行 | ✅ 混合搜索 |
安装
# 通过 OpenClaw 一键安装
openclaw skills install gbrain
# 或手动
bun add -g github:garrytan/gbrain
gbrain init --supabase
gbrain import ~/git/brain/
分析
优势:
- Garry Tan 真实使用验证(不是 demo,是生产系统)
- 知识模型设计精良(编译真相 + append-only 时间线)
- 梦境循环让知识自动积累,被动增强
- 混合搜索(向量 + 关键词 + RRF)在大规模数据下必要
- MCP 30 个工具,与 OpenClaw/Hermes 深度集成
- Git 作为真相来源,人类随时可编辑
- 开源,知识模型和技能文档详细
风险:
- Supabase Pro $25/月 + OpenAI/Anthropic API 成本
- TypeScript,对非 OpenClaw 用户集成门槛较高
- 5 天新项目,文档和工具可能快速变化
- Garry Tan 的使用模式(投资人、大量会议)不一定通用
- 依赖 OpenAI embedding,切换模型可能影响搜索质量
与 Jay 的关联:
- Jay 的 MEMORY.md 就是 gbrain 知识模型的雏形
- Jay 的 docs/deep-research/ 也是类似思路(报告 + 原始数据 + 日志)
- gbrain 的规模(10k+ 文件)是 Jay 当前体系的 100 倍+
- 梦境循环可以借鉴到 Jay 的 OpenClaw agent
- 最直接的启发:编译真相 + 时间线模式可以立即用在 MEMORY.md
与 Hindsight 对比:
| gbrain | Hindsight | |
|---|---|---|
| 知识模型 | 编译真相 + 时间线(Markdown) | 世界/经验/心智模型(结构化) |
| 检索 | 混合搜索(向量+关键词+RRF) | 4 路并行(语义+关键词+图+时间) |
| 反思 | 梦境循环(被动整合) | Reflect(主动深度分析) |
| 存储 | Git + Postgres + pgvector | PostgreSQL + pgvector |
| 数据来源 | 人类导入(会议/邮件/笔记) | API 编程注入 |
| 集成 | OpenClaw MCP(深度) | SDK + MCP |
| 适合 | 知识工作者(投资人/创始人) | Agent 开发者 |
两者互补:gbrain 擅长人类知识的积累和检索,Hindsight 擅长Agent 自动学习和反思。
评分
| 维度 | 评分 (1-10) | 说明 |
|---|---|---|
| 创新性 | 9 | 编译真相 + 时间线 + 梦境循环,设计精妙 |
| 实用性 | 8 | 真实生产验证,但成本和门槛不低 |
| 代码质量 | 8 | TypeScript,OpenClaw 生态原生 |
| 文档 | 10 | 技能文档极其详细,包含实战模式 |
| 生态 | 7 | OpenClaw/Hermes 深度集成,但通用性有限 |
| 可维护性 | 6 | 个人项目,但 Garry 有资源维护 |
| **总分** | **8.0** | 个人知识管理 + AI 的标杆级实现 |