gstack 深度研究:YC CEO 的 Claude Code 工作流——把一个 AI 变成一支团队
> 来源: https://github.com/garrytan/gstack
> 作者: Garry Tan(Y Combinator President & CEO)
> 参考: https://medium.com/coding-nexus/the-y-combinator-ceo-crushed-100-prs-in-7-days-with-claude-code-heres-his-exact-setup-42231b8dcf2b
> 配套工具: https://conductor.build (并行多 Agent 编排器)
> 研究时间: 2026-03-17
🎯 一句话版本
YC 的 CEO Garry Tan 把 Claude Code 从"一个通用助手"变成了"一支虚拟团队"——13 个 slash 命令让你按需召唤 CEO(产品直觉)、工程经理(架构设计)、Staff 工程师(代码审查)、QA 工程师(自动测试)、发布经理(一键发布)等不同角色。他用这套系统 7 天提交了 100 个 PR。
🏗️ 核心理念:认知模式切换
gstack 的核心洞见很简单:
> Planning 不是 Review。Review 不是 Shipping。Founder taste 不是 engineering rigor。如果把这些模糊在一起,你通常会得到一个四不像。
所以他给 Claude Code 设计了"显式的档位"——不同任务切换不同的"大脑模式"。
📋 13 个 Skills 详解
规划阶段(Plan Mode)
| Skill | 角色 | 做什么 |
|---|---|---|
| `/plan-ceo-review` | 创始人/CEO | **重新思考问题本身**。不接受字面需求,找到"10 星版本"的产品。Brian Chesky 模式。 |
| `/plan-eng-review` | 工程经理/Tech Lead | 锁定架构、数据流、状态机图、边界情况、测试矩阵 |
| `/plan-design-review` | 高级产品设计师 | 80 项检查清单、字母评级、**AI Slop 检测**、DESIGN.md 推断。只报告不改代码。 |
| `/design-consultation` | 设计顾问 | 从零构建完整设计系统——研究竞品、提出美学/排版/颜色/间距/动效方案、生成预览页、写 DESIGN.md |
开发阶段
| Skill | 角色 | 做什么 |
|---|---|---|
| `/review` | 偏执的 Staff 工程师 | 找到通过 CI 但在生产环境爆炸的 bug。分诊 Greptile review 评论。 |
| `/ship` | 发布工程师 | 同步 main、跑测试、解决 review、push、开 PR。6 个工具调用搞定。 |
QA 阶段
| Skill | 角色 | 做什么 |
|---|---|---|
| `/browse` | QA 工程师 | **给 Agent 装上眼睛**——登录、点击、截图、抓 breakage。60 秒完成完整 QA。 |
| `/qa` | QA + 修复工程师 | 测试 → 发现 bug → 修复(原子 commit)→ 重新验证。三档:Quick/Standard/Exhaustive。 |
| `/qa-only` | QA 报告员 | 只报告不修复。纯 bug 报告。 |
| `/qa-design-review` | 设计师 + 前端工程师 | 设计审计 + 自动修复。原子 `style(design):` commits,前后截图对比。 |
| `/setup-browser-cookies` | Session 管理 | 从真实浏览器(Chrome/Arc/Brave/Edge)导入 cookies 到 headless session |
收尾阶段
| Skill | 角色 | 做什么 |
|---|---|---|
| `/retro` | 工程经理 | 团队复盘:深度分析 + 每个贡献者的表扬和成长建议 |
| `/document-release` | 技术作家 | 更新 README/ARCHITECTURE/CONTRIBUTING 等文档 |
🔥 亮点分析
1. "AI Slop 检测"
/plan-design-review 里有一个我没见过的概念——AI Slop Score。它专门检测 AI 生成的设计是否有"AI 味":
> 评级示例:
> - Design Score: B
> - AI Slop Score: C
> - "我注意到三列图标网格、紫色渐变、千篇一律的 CTA——如果用一个词描述这个网站:template。"
这是对抗 AI 生成物同质化的一个有趣方向。
2. /plan-ceo-review 的"10 星产品"思维
来自 Brian Chesky(Airbnb CEO)的方法论——不是实现字面需求,而是问"真正的产品是什么":
你说:让卖家上传一张商品照片
普通 AI:加一个文件选择器,保存图片
/plan-ceo-review:照片上传不是功能。真正的工作是帮卖家创建能卖出去的 listing。
→ 自动识别产品 → 拉取规格和价格对比 → 起草标题和描述 → 建议最佳主图
3. Conductor:一人十 Agent
gstack 配合 Conductor(Mac app)可以同时运行 10 个 Claude Code session,每个在独立 workspace:
- Session 1:
/qa测试 staging - Session 2:
/review审查 PR - Session 3: 实现新功能
- Session 4-10: 其他分支上的任务
每个 workspace 有独立的 Chromium 实例——独立进程、cookies、标签页、日志,互不干扰。
4. 安装的巧妙设计
~/.claude/skills/gstack/ ← 全局安装
.claude/skills/gstack/ ← 项目级安装(提交到 repo,团队共享)
项目级安装用 cp -Rf 而不是 git submodule——git clone 直接就能用,不需要额外步骤。二进制和 node_modules 被 gitignore。
🤔 深度分析
gstack vs OpenClaw Skills
| gstack | OpenClaw Skills | |
|---|---|---|
| **目标** | Claude Code slash commands | OpenClaw 工作流 |
| **运行环境** | 本地 Claude Code CLI | 远程/本地 OpenClaw Gateway |
| **认知模式** | 预定义 13 种角色 | 自定义 Skill 文件 |
| **浏览器** | 内建 Playwright 二进制 | OpenClaw 内建 browser 工具 |
| **并行** | Conductor(Mac app) | OpenClaw sub-agents |
| **持久化** | 无(session 结束就没了) | 有(MEMORY.md + 文件系统) |
| **适合** | 编码为主的开发者 | 全能 Agent(编码 + 研究 + 运维 + 通信) |
关键区别:gstack 是为"编码→审查→发布"这个循环优化的。OpenClaw 是更通用的 Agent 平台。两者不冲突。
可借鉴的设计
1. 认知模式分离 — 我们的 AGENTS.md 可以考虑类似设计,不同任务用不同的 system prompt 指导
2. AI Slop 检测 — 对我们生成的报告也适用,可以加一个"模板化检测"
3. Atomic commits — /qa 每修一个 bug 一个独立 commit,审计友好
4. 前后对比截图 — /qa-design-review 修改前后截图对比,直观
局限性
- 仅限 Claude Code — 不支持 Codex、OpenCode 或其他 Agent
- 重编码轻研究 — 13 个 skill 全是编码流程,没有研究/分析/写作相关
- Conductor 闭源 — 核心的并行编排器是商业产品(Mac app)
- Bun 依赖 — 需要 Bun v1.0+,不是所有环境都有
- 无记忆 — session 之间没有持久记忆(vs OpenClaw 的 MEMORY.md)
💡 与我们的关联
1. "认知模式"可以借鉴
我们的 OpenClaw Agent 现在是"一个大脑做所有事"。可以考虑 gstack 的思路——给不同任务定义不同的认知模式:
/research-deep → 深度研究模式(当前默认)
/research-quick → 快速摘要模式
/review-code → 代码审查模式
/review-design → 设计审查模式
2. AI Slop 检测值得做
我们生成大量报告,确实可能出现"模板化"问题。可以借鉴 gstack 的 AI Slop Score,定期检查报告质量。
3. Conductor 的理念我们已经有了
OpenClaw 的 sub-agent 系统 + ACP 就是 Conductor 的等价物——多个 Agent 并行在独立 workspace。而且我们的更灵活(不限 Mac,支持多种 Agent 后端)。
4. 安装方式值得参考
gstack 的"复制到项目目录 + gitignore 二进制"模式比 git submodule 更友好,我们的 Skills 安装可以学习这个设计。
📊 评分
| 维度 | 评分(/10) |
|---|---|
| 实用性 | 9.0 — 即装即用,真实场景验证(YC CEO 日常使用) |
| 创新度 | 7.5 — "认知模式切换"是好洞见,但本质是精心设计的 prompt |
| 开源程度 | 8.0 — Skills 全开源,Conductor 闭源 |
| 生态影响 | 8.5 — YC CEO 背书 + 已有第三方文章/介绍站,社区增长快 |
| 与我们的关联 | 7.0 — 理念可借鉴,但我们用 OpenClaw 不用 Claude Code CLI |
| **综合** | **8.0** |
报告由深度研究助手自动生成 | 2026-03-17
来源: https://github.com/garrytan/gstack