Cloudflare AI Platform — 统一推理层，一个 API 调 14+ 供应商 70+ 模型

> 一句话版本：Cloudflare 把 AI Gateway 升级为统一推理层——一个 API 调 OpenAI、Anthropic、Google、字节、阿里等 14+ 供应商的 70+ 模型，自带自动故障转移、成本监控、流式断线恢复。还收购了 Replicate 团队。

项目	信息
来源	[blog.cloudflare.com/ai-platform](https://blog.cloudflare.com/ai-platform/)
发布日期	2026-04-16
作者	Ming Lu, Michelle Chen
背景	Cloudflare Agents Week

核心更新

之前：调用 OpenAI 用 OpenAI SDK，调用 Anthropic 用 Anthropic SDK，各自管理 Key 和费用。

现在：


const response = await env.AI.run('anthropic/claude-opus-4-6', {
  input: 'What is Cloudflare?',
}, {
  gateway: { id: "default" },
});

供应商列表：Alibaba Cloud, AssemblyAI, Bytedance, Google, InWorld, MiniMax, OpenAI, Pixverse, Recraft, Runway, Vidu + Cloudflare Workers AI 自托管

Agent 链式调用时，一个请求失败可能导致级联崩溃。AI Gateway 解决：


await env.AI.run('@cf/moonshotai/kimi-k2.5', 
  { prompt: 'What is AI Gateway?' }, 
  { metadata: { "teamId": "AI", "userId": 12345 } }
);

用 Replicate Cog 技术打包自定义模型：


# cog.yaml
build:
  python_version: "3.13"
  python_requirements: requirements.txt
predict: "predict.py:Predictor"

Cloudflare 的 AI 布局全景（Agents Week）：

产品	功能
AI Gateway	统一推理网关（本文）
Workers AI	自托管开源模型
Agents SDK	Agent 框架（onEmail、Durable Objects）
Email Service	Agent 邮箱接口（昨天发布）
Mesh	Agent 私有网络（之前报告过）
Replicate	自定义模型托管

Cloudflare 正在构建完整的 Agent 基础设施栈——从模型推理到通信到网络到邮箱。

和竞品的对比：

维度	Cloudflare AI Platform	OpenRouter	Azure AI
模型数量	70+	200+	100+
自动故障转移	✅	✅	❌
自托管模型	✅ Workers AI	❌	❌
全球边缘	✅ 330 城市	❌	有限
成本统一	✅	✅	✅
BYOM	🔄 Cog 即将支持	✅	✅
流式断线恢复	✅	❌	❌

优势：全球边缘网络 + 故障转移 + 流式恢复是 Cloudflare 的独特卖点。

劣势：模型数量比 OpenRouter 少，REST API 还没发布。

局限性：

维度	评分 (1-10)	说明
战略意义	9	统一推理层是 AI 基础设施的关键缺失块
技术设计	8	故障转移 + 流式恢复 + 边缘加速，思考到位
完成度	6	REST API 未发布，BYOM 早期，模型数偏少
生态整合	9	Replicate + Agents SDK + Email + Mesh 全链路
与 Jay 的关联	8	OpenClaw 模型代理层的潜在方案
总分	8.0	Cloudflare 正在成为 Agent 基础设施的水泥