ClawRouter:用智能路由省 74% 的 AI API 账单
> 来源: https://x.com/bc1beat/status/2030322072329548219
> 作者: E.H. Vicky (@bc1beat)
> GitHub: https://github.com/BlockRunAI/ClawRouter
> 日期: 2026-03-08
> 互动: 103 万次查看 · 226 喜欢 · 69 转帖 · 216 书签
📌 核心观点
> "You love Claude. Your wallet doesn't."
ClawRouter 是一个开源的本地代理(proxy),位于你的应用和 41+ 个 AI 模型之间,通过三层机制省钱:智能路由、Token 压缩、响应缓存。GitHub 上一个月内获得 5K stars。
🎯 问题定义
作者提出了一个大多数开发者不愿承认的事实:
> 你 100% 的请求都在付 Claude 价格,但只有 ~30% 真正需要 Claude。
典型工作负载分析
日常任务(~70% 的请求):
- "从这段文字中提取姓名和邮箱,返回 JSON" — 任何模型都能做
- "用 2 句话总结这个客服工单" — 摘要是已解决的问题
- "把这个错误信息翻译成西班牙语" — 翻译是商品化任务
- "useEffect 和 useLayoutEffect 有什么区别?" — 事实性问答
- "把这个 CSV 转成 markdown 表格" — 纯格式化
> 用兰博基尼去杂货店买菜。
真正需要 Claude 的任务(~30% 的请求):
- 复杂代码生成(多文件、多约束推理)
- 长文档分析(50 页合同的责任条款)
- 多步骤 Agent 编排
- 高级推理(分布式系统竞态条件调试)
🏗️ 三层省钱机制
Layer 1:智能路由(最大的赢家)
ClawRouter 在 <1ms 内对每个 prompt 评估 14 个维度,然后路由到能处理该任务的最便宜的模型。
效果:77% 的请求被路由到比 Sonnet 便宜 5-150 倍的模型。只有 ~23% 真正需要 Claude 的请求才发给 Claude。
Layer 2:Token 压缩(每个请求都省)
即使请求最终发给 Claude,ClawRouter 也会在发送前执行多层压缩:
- 默认启用,不改变语义
- 对 >180KB 的请求自动触发(Agent 工作流和长对话中常见)
- 可选的 observation 压缩层可将工具输出减少最多 97%
效果:
- 普通请求:7-15% 更少的 token
- 长上下文 Agent 工作负载:20-40%
Layer 3:响应缓存 + 请求去重(省 100%)
本地缓存响应。10 分钟内相同请求 → 即时返回,零成本。
常见场景:
- 重试逻辑:超时重试不会双倍付费
- 重复请求:多个用户/进程问同样的问题 → 一次 API 调用
- Agent 循环:Agentic 框架常用相同上下文重复查询
还能捕获并发重复:同时到达的相同请求只发一个到 provider。
💰 成本测算
以 10,000 次/月混合请求、平均 1000 输入 + 500 输出 token 为例:
| 方案 | 月成本 | 节省 |
|---|---|---|
| 纯 Claude Sonnet | ~$450 | — |
| ClawRouter 智能路由 | ~$130 | 71% |
| + Token 压缩 | ~$118 | 74% |
| + 响应缓存 | ~$105 | 77% |
🚀 快速开始
# 安装(启用智能路由)
curl -fsSL https://blockrun.ai/ClawRouter-update | bash
openclaw gateway restart
# 用 USDC 在 Base 或 Solana 上充值钱包($5 够用数千次请求)
💡 分析与评价
商业模式
ClawRouter 本身开源(MIT),但它是 BlockRun 生态的一部分——一个 AI 模型市场。赚钱方式是:
1. 用户通过 USDC(加密货币)充值钱包
2. 请求通过 BlockRun 的 API 路由
3. BlockRun 在模型调用中抽取差价
这是一个加密支付 + AI 代理路由的组合商业模式。
技术评估
智能路由的 14 个维度评分是核心竞争力。这不是简单的"长就发 Claude,短就发便宜模型",而是多维度评估任务复杂度。但文章没有详细说明这 14 个维度是什么,这是一个透明度问题。
Token 压缩声称不改变语义,但对于需要精确措辞的场景(法律文本、代码注释),任何压缩都有风险。
与类似项目对比
| 项目 | 路由 | 压缩 | 缓存 | 支付 | 模型数 |
|---|---|---|---|---|---|
| **ClawRouter** | ✅ 14 维评分 | ✅ 多层 | ✅ | USDC | 41+ |
| **NadirClaw** | ✅ | ❌ | ❌ | API Key | 多 |
| **iblai-openclaw-router** | ✅ | ❌ | ❌ | API Key | Claude 系列 |
| 手动切模型 | ❌ | ❌ | ❌ | 各自 API Key | 手动 |
⚠️ 值得注意的风险
1. 加密支付门槛:需要 USDC 钱包,对非 crypto 用户有障碍
2. 中间人风险:所有请求经过 BlockRun API,数据安全需要信任第三方
3. 路由准确性:如果把需要 Claude 的任务错误路由到便宜模型,质量下降可能比省的钱更贵
4. 推文的营销色彩:103 万次查看、5K stars 在一个月内 → 可能有推广成分
5. "省 74%"的前提:基于特定工作负载假设,实际节省因场景而异
评分
| 维度 | 评分(/10) |
|---|---|
| 技术方案 | 8 |
| 实用价值 | 8.5 |
| 透明度 | 6.5 |
| 生态成熟度 | 7 |
| 风险控制 | 6 |
| **综合** | **7.2** |
🔗 与我们的关联
1. 直接可用:我们用 OpenClaw,ClawRouter 是 OpenClaw 原生集成的
2. 成本优化思路:即使不用 ClawRouter,"70% 的请求不需要最贵模型"的思路值得借鉴
3. 与之前报告的关联:
- AI API 中转灰色市场 — ClawRouter 是合法的成本优化方案,vs 灰色中转
- Lobster 工作流 — Agent 工作流中的 token 压缩场景
4. 加密支付趋势:USDC 微支付 + AI 模型路由,这个方向值得观察
报告由深度研究助手自动生成 | 2026-03-08