OpenAI 威胁情报报告：AI 如何被滥用来诈骗、影响舆论和骚扰异见人士

🎯 一句话版本

关于OpenAI 威胁情报报告：AI 如何被滥用来诈骗、影响舆论和骚扰异见人士的深度研究报告

> 来源: https://cdn.openai.com/pdf/df438d70-e3fe-4a6c-a403-ff632def8f79/disrupting-malicious-uses-of-ai.pdf

> 发布: OpenAI，2026年2月

> 系列: "Disrupting malicious uses of our models" — 第7次季度更新

> 研究时间: 2026-03-16

📌 一句话总结

OpenAI 最新威胁情报报告披露了 7 个案例：来自柬埔寨的 AI 辅助罗曼斯诈骗、冒充 FBI 的假律师骗局、俄罗斯内容农场、多国协调虚假宣传行动，以及最重量级的——中国执法机关系统性"网络特战"（网络特战）的完整内部行动文件首次曝光。

核心结论：AI 没有给威胁行为者带来新的进攻能力，只是让旧剧本跑得更快。

📊 案例全览

行动代号	来源	目标	AI用途	影响力评估
"Date Bait"	柬埔寨	印尼年轻男性	罗曼斯诈骗内容生成+翻译	每月数百受害者，每天$数千
"False Witness"	柬埔寨	诈骗受害者	伪造律师事务所、冒充FBI	个人损失数千美元
"Silver Lining Playbook"	中国大陆	美国州级官员	社会工程学邮件、换脸软件咨询	未知（疑似情报招募）
"Trolling Stone"	巴基斯坦/亚美尼亚/乌拉圭	阿根廷媒体/司法系统	批量生成评论和新闻文章	IO冲击量表 Category 4
"No Bell"	不明	非洲地区	批量生成批评美国内容	低
"Fish Food"	俄罗斯 Rybar	非洲各国选举	翻译+评论生成，内容农场	Category 3（多平台传播）
"Cyber Special Operations"	🇨🇳 中国执法机关	全球异见人士+日本首相	行动规划+状态报告润色	混合（部分高影响，大多数低效）

🔍 案例深度解析

1. 柬埔寨罗曼斯诈骗："Date Bait"

流程拆解（Ping → Zing → Sting）：


Ping: 在 Instagram/社交媒体投放精准广告
  → 目标: 喜欢高档生活方式的印尼男性
  → 关键词: golf, yachts, fine dining

Zing: 把目标引到 Telegram
  → 半人工+半自动的"AI 接待员"角色
  → "LoveCode"/"SexAction" 假约会平台
  → ChatGPT 生成情感操控消息

Sting: "最终杀招"
  → 虚构"任务"费用，一笔比一笔大
  → 最终: "数据处理错误" → 要求支付 $12,000
  → 受害者付款后立即被拉黑

内部组织架构：Lead Generation → Reception Team → Supervisor Team → 每日"目标估值"报告

2. 中国"网络特战"：最重磅披露

这是报告中篇幅最长、最有价值的案例。一个与中国执法机关相关联的 ChatGPT 账号被封禁，其活动揭示了规模惊人的系统性行动：

尝试（并被拒绝）的行动：针对高市早苗

用户请求 ChatGPT 帮助策划针对日本首相高市早苗（因批评新疆人权状况）的影响力行动，包含 6 个方向：

1. 在网上放大负面评论

2. 伪造外国居民邮件，向日本政界投诉

3. 用假账号放大生活成本矛盾

4. 指控其右翼倾向

5. 借美国关税问题转移视线

6. 传播内蒙古"正面形象"

OpenAI 的模型拒绝了这个请求。但几周后，用户提交了该行动的进度报告，说明行动在没有 ChatGPT 的情况下已经继续推进。

验证到的真实活动

研究人员通过开源调查，验证了报告中描述的部分活动真实存在：

反高市标签 #右翼共生者 在 X/Pixiv/Blogspot 上传播（2025年10月）
revealscum[.]com — 针对20+ 异见人士的"曝光网站"（OpenAI 2024年5月首次曝光，现确认与此账号相连）
"李老师不是你老师" 李颖的骚扰活动有对应 X 账号足迹
惠波的 X 账号被限制，搜索时出现大量同名假账号
Bluesky 上至少5个冒充惠波的账号，均于2024年12月5日同日创建
假讣告行动：在 X 上发布异见人士解志坚的假死亡消息（2023年8月，VoA 已报道）

规模数字（来自内部状态报告）

维度	数字
单省专职操作员	300+
覆盖境外平台	300+
运作战术	100+ 种
中国内网帖子	数百万
境外帖子	数万（包括50,000+帖子到200+西方平台）
获得300+互动的帖子比例	<150条（占比 <0.3%）

使用的 AI 模型：DeepSeek-R1、Qwen2.5、YOLOv8（本地部署开源模型，而非 ChatGPT）

手段清单（部分）

大规模举报异见人士账号（附 AI 生成的"虚假截图证据"）
伪装成美国移民官警告异见人士
伪造美国县法院文件提交给社交平台要求下架
创建大量与目标同名账号（Bluesky 预先占位战术）
线下骚扰：在异见人士家属附近张贴海报，拍照后在网上传播
伪造社交媒体截图当"证据"举报

3. 俄罗斯 Rybar："Fish Food"

主 Telegram 频道 1.4M 订阅者
使用 ChatGPT 翻译、生成评论，然后由不同账号同步发布
一批生成的 7 条推文：观看量从 150,000 到 57 不等
关键发现：决定传播效果的是账号粉丝量，而非 AI 内容质量
已制定非洲选举干预计划，年度预算最高 $600,000

💡 关键结论

AI 的实际作用

> "We continue to see threat actors bolt AI onto old playbooks to move faster, not gain novel offensive capability from our models." — OpenAI

AI 在恶意行动中的实际用途：

✅ 翻译（中→英/西→英）
✅ 内容润色（让文字更"母语"）
✅ 批量生成相似帖子
✅ 内部文档整理
❌ 没有带来新的进攻能力
❌ 无法突破社交平台的传播算法

为什么大多数行动效果很差？

1. 算法不认 AI 生成内容：同一批推文，有 150,000 次观看，有 57 次——差距来自账号粉丝量

2. 平台封号速度加快：反高市行动在头几天就有 ~200 个账号被各平台下架

3. 真实受众不买账：大多数 IO 内容只在操作者自己的网络内循环

OpenAI 的防御手段

封禁违规账号（2024年2月至今：40+ 网络）
与行业伙伴和政府机构共享情报
使用 AI 加速调查团队的排查工作
公开发布威胁报告（提高公众意识）

💡 与我们的关联

1. 对 AI 产品设计的启示

安全护栏有效：ChatGPT 成功拒绝了"策划针对外国政府首脑的影响力行动"请求。但没能阻止用户继续使用模型来润色已完成的行动报告。→ 护栏边界比人们想象的更难划清。
本地部署 AI 的威胁：中国威胁行为者主要使用本地部署的 DeepSeek/Qwen，不通过 OpenAI 的护栏。开源模型是监管盲区。

2. OpenClaw 相关

我们的 Agent 系统如果被滥用，可能成为类似的批量内容生成工具
Cron + 消息系统 如果开放给陌生人，就是一个现成的"影响力行动工具包"
→ 白名单机制（authorized senders）的安全价值比想象的大

3. "行动效果 ≠ 行动规模"

报告最反直觉的发现：50,000 个帖子，<150 个获得互动。这对那些认为"AI 会让虚假信息问题爆炸性增长"的担忧提供了一些反驳——传播效果主要受账号可信度决定，而非内容量。

📊 评分

维度	评分（/10）
信息密度	9.0 — 包含完整行动内部文件，非常罕见
可信度	9.5 — OpenAI 一手研究 + 开源验证
重要性	9.0 — 首次揭示中国"网络特战"完整内部架构
与我们的关联	7.5 — 对 AI 产品设计和安全有直接启示
综合	8.8

报告由深度研究助手自动生成 | 2026-03-16

来源: https://cdn.openai.com/pdf/df438d70-e3fe-4a6c-a403-ff632def8f79/disrupting-malicious-uses-of-ai.pdf

评分

维度	分数	说明
创意	?/10
技术深度	?/10
实用性	?/10
影响力	?/10
数据支撑	?/10
与我们的相关性	?/10
综合	?/10	需要后续评估

> 一句话总结：（报告的核心价值与我们的关联）

评分

维度	分数	说明
创意	?/10
技术深度	?/10
实用性	?/10
影响力	?/10
数据支撑	?/10
与我们的相关性	?/10
综合	?/10	需要后续评估

> 一句话总结：（报告的核心价值与我们的关联）