Cloudflare AI Platform — 统一推理层,一个 API 调 14+ 供应商 70+ 模型

> 一句话版本:Cloudflare 把 AI Gateway 升级为统一推理层——一个 API 调 OpenAI、Anthropic、Google、字节、阿里等 14+ 供应商的 70+ 模型,自带自动故障转移、成本监控、流式断线恢复。还收购了 Replicate 团队。

项目信息
来源[blog.cloudflare.com/ai-platform](https://blog.cloudflare.com/ai-platform/)
发布日期2026-04-16
作者Ming Lu, Michelle Chen
背景Cloudflare Agents Week

核心更新

1. 统一推理层:一个 API,所有模型

之前:调用 OpenAI 用 OpenAI SDK,调用 Anthropic 用 Anthropic SDK,各自管理 Key 和费用。

现在


const response = await env.AI.run('anthropic/claude-opus-4-6', {
  input: 'What is Cloudflare?',
}, {
  gateway: { id: "default" },
});

供应商列表:Alibaba Cloud, AssemblyAI, Bytedance, Google, InWorld, MiniMax, OpenAI, Pixverse, Recraft, Runway, Vidu + Cloudflare Workers AI 自托管

2. 自动故障转移(Auto Failover)

Agent 链式调用时,一个请求失败可能导致级联崩溃。AI Gateway 解决:

3. 统一成本监控


await env.AI.run('@cf/moonshotai/kimi-k2.5', 
  { prompt: 'What is AI Gateway?' }, 
  { metadata: { "teamId": "AI", "userId": 12345 } }
);

4. Bring Your Own Model(BYOM)

Replicate Cog 技术打包自定义模型:


# cog.yaml
build:
  python_version: "3.13"
  python_requirements: requirements.txt
predict: "predict.py:Predictor"

5. Replicate 团队加入

6. 多模态扩展

7. 极速首 Token

分析

Cloudflare 的 AI 布局全景(Agents Week):

产品功能
AI Gateway统一推理网关(本文)
Workers AI自托管开源模型
Agents SDKAgent 框架(onEmail、Durable Objects)
Email ServiceAgent 邮箱接口(昨天发布)
MeshAgent 私有网络(之前报告过)
Replicate自定义模型托管

Cloudflare 正在构建完整的 Agent 基础设施栈——从模型推理到通信到网络到邮箱。

和竞品的对比

维度Cloudflare AI PlatformOpenRouterAzure AI
模型数量70+200+100+
自动故障转移
自托管模型✅ Workers AI
全球边缘✅ 330 城市有限
成本统一
BYOM🔄 Cog 即将支持
流式断线恢复

优势:全球边缘网络 + 故障转移 + 流式恢复是 Cloudflare 的独特卖点。

劣势:模型数量比 OpenRouter 少,REST API 还没发布。

局限性

与 Jay 的关联

评分

维度评分 (1-10)说明
战略意义9统一推理层是 AI 基础设施的关键缺失块
技术设计8故障转移 + 流式恢复 + 边缘加速,思考到位
完成度6REST API 未发布,BYOM 早期,模型数偏少
生态整合9Replicate + Agents SDK + Email + Mesh 全链路
与 Jay 的关联8OpenClaw 模型代理层的潜在方案
**总分****8.0**Cloudflare 正在成为 Agent 基础设施的水泥