Deep Research as a Service:把 AI 深度研究做成产品

> 来源: 内部方案讨论 + inference.sh 技术调研

> 日期: 2026-04-04

> 类型: 产品设计方案

> 状态: 概念设计阶段

🎯 一句话版本

我们已经跑了 290+ 篇 AI 深度研究报告,现在要把这个能力产品化——用户丢一个链接进来,AI 自动抓取、搜索补充资料、生成专业级研究报告。考虑用 inference.sh 做后端运行时快速验证。

为什么做这件事?

已验证的能力

过去几个月,我们用 OpenClaw + Claude Opus 在 Discord 频道里跑了一套 deep-research 流程:

指标数据
已产出报告290+ 篇
平均生成时间2-5 分钟/篇
覆盖话题AI infra / 区块链 / 开发者工具 / 开源项目
发布平台[temp.jaylab.io](https://temp.jaylab.io/)
报告质量平均 8.0/10(自评)

核心流程


链接 → web_fetch 抓取 → web_search 补充 → Claude 生成报告
    → 保存 Markdown → 部署到 Cloudflare Pages → 回复用户

这套流程已经稳定运行,问题是:只有我们自己在用

市场信号

我们的差异化:深度。不是搜索结果的拼贴,而是带分析、评分、关联性讨论的研究报告。

产品形态

用户怎么用?

Phase 1 — Web UI


用户打开网站 → 粘贴链接 → 选择研究深度 → 等 2-5 分钟 → 看报告

Phase 2 — API


import deepresearch

report = deepresearch.analyze("https://github.com/some/project")
print(report.summary)    # 一句话版本
print(report.markdown)   # 完整报告
print(report.score)      # 综合评分

Phase 3 — MCP Server


{
  "mcpServers": {
    "deep-research": {
      "type": "streamablehttp",
      "url": "https://api.deepresearch.ai/mcp",
      "headers": { "Authorization": "Bearer TOKEN" }
    }
  }
}

任何 MCP 客户端(Claude Desktop、Cursor、OpenClaw)都能直接调用。

报告包含什么?

基于我们 290+ 篇报告的积累,标准模板:

1. 一句话版本 — 让非技术人员也能秒懂

2. 核心内容 — 是什么、解决什么问题

3. 技术分析 — 架构、实现、优劣

4. 评分表 — 创意/实用性/技术/生态/透明度

5. 关联分析 — 这东西跟你的项目有什么关系(可定制)

6. 关键链接 — 所有原始来源

技术架构

方案对比

inference.sh自建 (VPS+Queue)CF Workers
开发时间1-2 周4-6 周3-4 周
运维零(托管)需自管
扩容自动手动自动
成本/篇~$0.15~$0.10~$0.10
控制权
Durable Execution✅ 内建需自建❌ 受限
可观测性✅ Execution Graph需自建❌ 有限
多用户隔离✅ 内建需自建需自建

推荐路径:inference.sh MVP → 自建迁移

阶段 1:用 inference.sh 快速验证(1-2 周)


inference.sh Agent: "deep-researcher"
├── Tool: web-fetch (自建 App)
├── Tool: web-search (内置 Tavily/Exa)
├── Tool: analyze (自建 App, 调用 LLM)
└── Output: Markdown 报告

inference.sh 提供:

阶段 2:确认 PMF 后自建(4-6 周)


Next.js (前端)
  ↓
API Server (Node.js/Go)
  ↓
Redis Queue (BullMQ)
  ↓
Workers (OpenClaw agent 实例 × N)
  ↓
PostgreSQL (用户/报告) + R2 (报告文件)

自建原因:

成本模型

每篇研究的成本

组件Sonnet 方案Opus 方案
LLM 输入 (~50K tokens)$0.015$0.25
LLM 输出 (~5K tokens)$0.04$0.125
Web Search (~5 次)$0.025$0.025
Web Fetch (~5 次)~免费~免费
inference.sh 执行费~$0.05~$0.05
**总成本****~$0.13****~$0.45**

定价方案

层级价格包含单价毛利率
Free$03 篇/天-获客成本
Pro$9.9/月100 篇$0.099~24%
Team$29/月500 篇$0.058亏(需 Opus 降级)
API按次$0.30/篇$0.30~54%

> ⚠️ 关键洞察:用 Sonnet 做标准版保证毛利为正,Opus 作为 Premium 附加收费(+$0.50/篇),或者等 MiMo-V2-Pro 这类低成本模型质量追上来。

差异化与护城河

我们有什么别人没有的?

1. 290+ 篇报告的模板和 prompt 积累 — 不是通用研究,是经过迭代的专业模板

2. 一句话版本 + 评分体系 — 让非技术读者也能快速理解

3. 领域专注 — 先做 AI/开发者工具赛道,比通用搜索更深

4. 双语支持 — 中英文报告,覆盖中文开发者市场(Perplexity 的弱项)

护城河在哪?

坦率说——目前没有强护城河。主要靠:

长期需要建立:

风险清单

风险严重度缓解策略
inference.sh 团队不明/可能跑路阶段 1 仅做验证,阶段 2 迁移自建
Sonnet 研究质量不够A/B 测试 Sonnet vs Opus,用户调研
Perplexity/ChatGPT 碾压差异化:深度 > 速度,专注垂直领域
获客成本高先从现有 290+ 报告做 SEO 引流
用户留存低研究历史 + 个性化推荐

行动计划

第一步(本周):验证需求

第二步(验证后 1-2 周):inference.sh MVP

第三步(MVP 验证后 4-6 周):自建迁移

评分

维度分数说明
市场机会8/10AI 研究赛道热,但巨头已入场
技术可行性9/10核心流程已验证 290+ 次
商业模型6.5/10Sonnet 方案毛利薄,需精细控制成本
差异化6/10模板/深度是优势,但护城河不深
执行难度7/10MVP 快,但产品化细节多
时机8.5/10Agent 生态爆发期,MCP 协议推广中
**综合****7.5/10**

关键链接

> 一句话总结:我们有 290+ 篇 AI 深度研究报告的生产经验,现在考虑产品化。推荐路径:先用 inference.sh 做 MVP 快速验证需求(1-2 周),确认 PMF 后迁移自建控制成本。核心挑战不是技术——是差异化和获客。先把现有报告做成 landing page,收集 50 个用户请求验证需求再说。