如何成为世界级 Agentic 工程师:一份实战指南
> 来源: https://x.com/systematicls/status/2028814227004395561
> 作者: sysls (@systematicls)
> 日期: 2026-03-03
> 热度: 2.6M 浏览 | 7.2K 点赞 | 23K 收藏
📌 核心内容
这是一篇在 X 上爆火的长文,作者 sysls 是一位资深 AI Agent 工程师,从 Agent 刚能写代码的时期就开始使用,用 Agent 构建过生产级的信号系统、基础设施和数据管道。文章的核心论点是:你不需要花哨的工具和框架,回归基本原则才是王道。
🧠 关键观点提炼
1. 少即是多:抛弃工具焦虑
> "你不需要最新的 agentic 框架,不需要安装一百万个包,也不需要读一百万篇文章来保持竞争力。事实上,你的热情可能弊大于利。"
作者目前使用几乎最精简的配置 —— 只用基础 CLI(Claude Code 和 Codex),就能完成最突破性的工作。
2. 上下文是一切
上下文膨胀(context bloat)是 Agent 表现差的首要原因。太多插件、记忆系统、技能文件会让 Agent 在不相关的信息中迷失。
核心原则:只给 Agent 完成当前任务所需的精确信息,不多不少。
3. 研究与实现分离
❌ "帮我建一个认证系统"
✅ "用 JWT + bcrypt-12 密码哈希实现认证,refresh token 7 天过期轮换..."
不精确的指令会迫使 Agent 做不必要的调研,用无关信息污染上下文。正确做法:
1. 先开一个研究任务探索方案
2. 决定方案后,用全新上下文的 Agent 来实现
4. 利用讨好倾向(Sycophancy)
Agent 被设计为尽力满足你的指令,这意味着:
- ❌ "找出数据库的 bug" → 它会「制造」bug 来取悦你
- ✅ "检查数据库,跟着每个组件的逻辑走,报告所有发现" → 中性提示
高级玩法:三 Agent 对抗体系
1. Bug 猎手(带奖励偏置)→ 找出所有可能的 bug(超集)
2. 对抗 Agent(带惩罚偏置)→ 尝试反驳每个 bug(子集)
3. 裁判 Agent → 做最终裁决
5. 如何判断什么工具有用?
> "如果 OpenAI 和 Claude 都实现了它或收购了实现它的公司……那它可能有用。"
作者举例:技能(Skills)、记忆、规划功能都从社区实践进入了官方产品。而那些曾经「必备」的 stop-hook,在 Codex 5.2 发布后就过时了。
结论:定期更新 CLI 工具,读一下新功能,就足够了。
6. CLAUDE.md 应该是逻辑路由器
CLAUDE.md 不应该是 26000 行的巨型文件,而应该是一个条件分发目录:
如果在写代码 → 读 coding-rules.md
如果在写测试 → 读 coding-test-rules.md
如果测试失败 → 读 coding-test-failing-rules.md
保持 CLAUDE.md 尽可能精简,只包含"在什么场景下去哪找上下文"的 IF-ELSE 逻辑。
7. 任务合约(Task Contract)
Agent 知道怎么开始任务,但不知道怎么结束任务。解决方案:
- 创建
{TASK}_CONTRACT.md,明确列出完成条件 - 必须通过的测试 + 截图验证
- 用 stop-hook 阻止 Agent 在合约未完成时终止
8. 长时间运行 Agent 的正确姿势
❌ 24 小时单 session → 上下文膨胀,不同任务互相污染
✅ 每个合约一个新 session → 编排层负责创建合约和启动 session
9. 迭代而非一步到位
- 从精简配置开始
- 遇到不满意的行为 → 写成规则(Rule)
- 有特定做事方式 → 写成技能(Skill)
- 规则和技能积累太多 → 定期清理整合,消除矛盾
💡 分析与评价
为什么这篇文章火了
1. 直击痛点:大量开发者被 agentic 工具生态搞得焦虑,这篇文章给出了「放下屠刀」的清晰指引
2. 实战背景:作者不是理论家,有大规模生产环境的 Agent 使用经验
3. 反直觉洞察:在所有人都在追求更多工具的时候,说「少就是多」需要勇气和实力
4. 可操作性强:每个观点都附带具体的做法和例子
与业界趋势的对应
文章提到的很多观点与当前趋势吻合:
- Anthropic 和 OpenAI 确实在快速将社区最佳实践内化为产品功能
- 上下文窗口管理已被公认为 Agent 性能的核心瓶颈
- "研究与实现分离"与 Anthropic 推荐的 multi-agent 模式一致
值得商榷的地方
- 对于复杂项目,纯 CLI 可能不够,IDE 集成有其价值
- "不需要外部工具"的说法对新手可能误导——有些工具确实能降低入门门槛
- 三 Agent 对抗体系的 token 成本不低
评分
| 维度 | 评分(/10) |
|---|---|
| 实用价值 | 9 |
| 原创洞察 | 8 |
| 可操作性 | 9 |
| 写作质量 | 8 |
| **综合** | **8.5** |
🔗 与我们的关联
这篇文章对我们使用 AI Agent 有直接指导意义:
1. CLAUDE.md / AGENTS.md 设计:保持精简,作为条件路由器而非百科全书
2. 任务设计:给 Agent 精确指令而非模糊目标,先研究再实现
3. 上下文管理:警惕规则和技能的积累导致上下文膨胀,定期清理
4. 利用讨好倾向:用中性提示避免引导性偏差,或用对抗体系提高可靠性
5. 工具选择:不用追新,关注 Claude/Codex 官方更新就够了
> 💬 作者的核心忠告:Keep it simple, use rules and skills and CLAUDE.md as a directory and be religiously mindful about their context and their design limitations.
报告由深度研究助手自动生成 | 2026-03-06