如何成为世界级 Agentic 工程师：一份实战指南

🎯 一句话版本

关于如何成为世界级 Agentic 工程师：一份实战指南的深度研究报告

> 来源: https://x.com/systematicls/status/2028814227004395561

> 作者: sysls (@systematicls)

> 日期: 2026-03-03

> 热度: 2.6M 浏览 | 7.2K 点赞 | 23K 收藏

📌 核心内容

这是一篇在 X 上爆火的长文，作者 sysls 是一位资深 AI Agent 工程师，从 Agent 刚能写代码的时期就开始使用，用 Agent 构建过生产级的信号系统、基础设施和数据管道。文章的核心论点是：你不需要花哨的工具和框架，回归基本原则才是王道。

🧠 关键观点提炼

1. 少即是多：抛弃工具焦虑

> "你不需要最新的 agentic 框架，不需要安装一百万个包，也不需要读一百万篇文章来保持竞争力。事实上，你的热情可能弊大于利。"

作者目前使用几乎最精简的配置 —— 只用基础 CLI（Claude Code 和 Codex），就能完成最突破性的工作。

2. 上下文是一切

上下文膨胀（context bloat）是 Agent 表现差的首要原因。太多插件、记忆系统、技能文件会让 Agent 在不相关的信息中迷失。

核心原则：只给 Agent 完成当前任务所需的精确信息，不多不少。

3. 研究与实现分离

❌ "帮我建一个认证系统"

✅ "用 JWT + bcrypt-12 密码哈希实现认证，refresh token 7 天过期轮换..."

不精确的指令会迫使 Agent 做不必要的调研，用无关信息污染上下文。正确做法：

1. 先开一个研究任务探索方案

2. 决定方案后，用全新上下文的 Agent 来实现

4. 利用讨好倾向（Sycophancy）

Agent 被设计为尽力满足你的指令，这意味着：

❌ "找出数据库的 bug" → 它会「制造」bug 来取悦你
✅ "检查数据库，跟着每个组件的逻辑走，报告所有发现" → 中性提示

高级玩法：三 Agent 对抗体系

1. Bug 猎手（带奖励偏置）→ 找出所有可能的 bug（超集）

2. 对抗 Agent（带惩罚偏置）→ 尝试反驳每个 bug（子集）

3. 裁判 Agent → 做最终裁决

5. 如何判断什么工具有用？

> "如果 OpenAI 和 Claude 都实现了它或收购了实现它的公司……那它可能有用。"

作者举例：技能（Skills）、记忆、规划功能都从社区实践进入了官方产品。而那些曾经「必备」的 stop-hook，在 Codex 5.2 发布后就过时了。

结论：定期更新 CLI 工具，读一下新功能，就足够了。

6. CLAUDE.md 应该是逻辑路由器

CLAUDE.md 不应该是 26000 行的巨型文件，而应该是一个条件分发目录：


如果在写代码 → 读 coding-rules.md
  如果在写测试 → 读 coding-test-rules.md
    如果测试失败 → 读 coding-test-failing-rules.md

保持 CLAUDE.md 尽可能精简，只包含"在什么场景下去哪找上下文"的 IF-ELSE 逻辑。

7. 任务合约（Task Contract）

Agent 知道怎么开始任务，但不知道怎么结束任务。解决方案：

创建 {TASK}_CONTRACT.md，明确列出完成条件
必须通过的测试 + 截图验证
用 stop-hook 阻止 Agent 在合约未完成时终止

8. 长时间运行 Agent 的正确姿势

❌ 24 小时单 session → 上下文膨胀，不同任务互相污染

✅ 每个合约一个新 session → 编排层负责创建合约和启动 session

9. 迭代而非一步到位

从精简配置开始
遇到不满意的行为 → 写成规则（Rule）
有特定做事方式 → 写成技能（Skill）
规则和技能积累太多 → 定期清理整合，消除矛盾

💡 分析与评价

为什么这篇文章火了

1. 直击痛点：大量开发者被 agentic 工具生态搞得焦虑，这篇文章给出了「放下屠刀」的清晰指引

2. 实战背景：作者不是理论家，有大规模生产环境的 Agent 使用经验

3. 反直觉洞察：在所有人都在追求更多工具的时候，说「少就是多」需要勇气和实力

4. 可操作性强：每个观点都附带具体的做法和例子

与业界趋势的对应

文章提到的很多观点与当前趋势吻合：

Anthropic 和 OpenAI 确实在快速将社区最佳实践内化为产品功能
上下文窗口管理已被公认为 Agent 性能的核心瓶颈
"研究与实现分离"与 Anthropic 推荐的 multi-agent 模式一致

值得商榷的地方

对于复杂项目，纯 CLI 可能不够，IDE 集成有其价值
"不需要外部工具"的说法对新手可能误导——有些工具确实能降低入门门槛
三 Agent 对抗体系的 token 成本不低

评分

维度	评分（/10）
实用价值	9
原创洞察	8
可操作性	9
写作质量	8
综合	8.5

🔗 与我们的关联

这篇文章对我们使用 AI Agent 有直接指导意义：

1. CLAUDE.md / AGENTS.md 设计：保持精简，作为条件路由器而非百科全书

2. 任务设计：给 Agent 精确指令而非模糊目标，先研究再实现

3. 上下文管理：警惕规则和技能的积累导致上下文膨胀，定期清理

4. 利用讨好倾向：用中性提示避免引导性偏差，或用对抗体系提高可靠性

5. 工具选择：不用追新，关注 Claude/Codex 官方更新就够了

> 💬 作者的核心忠告：Keep it simple, use rules and skills and CLAUDE.md as a directory and be religiously mindful about their context and their design limitations.

报告由深度研究助手自动生成 | 2026-03-06

评分

维度	分数	说明
创意	?/10
技术深度	?/10
实用性	?/10
影响力	?/10
数据支撑	?/10
与我们的相关性	?/10
综合	?/10	需要后续评估

> 一句话总结：（报告的核心价值与我们的关联）

评分

维度	分数	说明
创意	?/10
技术深度	?/10
实用性	?/10
影响力	?/10
数据支撑	?/10
与我们的相关性	?/10
综合	?/10	需要后续评估

> 一句话总结：（报告的核心价值与我们的关联）