OpenAI 威胁情报报告:AI 如何被滥用来诈骗、影响舆论和骚扰异见人士
> 来源: https://cdn.openai.com/pdf/df438d70-e3fe-4a6c-a403-ff632def8f79/disrupting-malicious-uses-of-ai.pdf
> 发布: OpenAI,2026年2月
> 系列: "Disrupting malicious uses of our models" — 第7次季度更新
> 研究时间: 2026-03-16
📌 一句话总结
OpenAI 最新威胁情报报告披露了 7 个案例:来自柬埔寨的 AI 辅助罗曼斯诈骗、冒充 FBI 的假律师骗局、俄罗斯内容农场、多国协调虚假宣传行动,以及最重量级的——中国执法机关系统性"网络特战"(网络特战)的完整内部行动文件首次曝光。
核心结论:AI 没有给威胁行为者带来新的进攻能力,只是让旧剧本跑得更快。
📊 案例全览
| 行动代号 | 来源 | 目标 | AI用途 | 影响力评估 |
|---|---|---|---|---|
| **"Date Bait"** | 柬埔寨 | 印尼年轻男性 | 罗曼斯诈骗内容生成+翻译 | 每月数百受害者,每天$数千 |
| **"False Witness"** | 柬埔寨 | 诈骗受害者 | 伪造律师事务所、冒充FBI | 个人损失数千美元 |
| **"Silver Lining Playbook"** | 中国大陆 | 美国州级官员 | 社会工程学邮件、换脸软件咨询 | 未知(疑似情报招募) |
| **"Trolling Stone"** | 巴基斯坦/亚美尼亚/乌拉圭 | 阿根廷媒体/司法系统 | 批量生成评论和新闻文章 | IO冲击量表 Category 4 |
| **"No Bell"** | 不明 | 非洲地区 | 批量生成批评美国内容 | 低 |
| **"Fish Food"** | 俄罗斯 Rybar | 非洲各国选举 | 翻译+评论生成,内容农场 | Category 3(多平台传播) |
| **"Cyber Special Operations"** | 🇨🇳 中国执法机关 | 全球异见人士+日本首相 | 行动规划+状态报告润色 | 混合(部分高影响,大多数低效) |
🔍 案例深度解析
1. 柬埔寨罗曼斯诈骗:"Date Bait"
流程拆解(Ping → Zing → Sting):
Ping: 在 Instagram/社交媒体投放精准广告
→ 目标: 喜欢高档生活方式的印尼男性
→ 关键词: golf, yachts, fine dining
Zing: 把目标引到 Telegram
→ 半人工+半自动的"AI 接待员"角色
→ "LoveCode"/"SexAction" 假约会平台
→ ChatGPT 生成情感操控消息
Sting: "最终杀招"
→ 虚构"任务"费用,一笔比一笔大
→ 最终: "数据处理错误" → 要求支付 $12,000
→ 受害者付款后立即被拉黑
内部组织架构:Lead Generation → Reception Team → Supervisor Team → 每日"目标估值"报告
2. 中国"网络特战":最重磅披露
这是报告中篇幅最长、最有价值的案例。一个与中国执法机关相关联的 ChatGPT 账号被封禁,其活动揭示了规模惊人的系统性行动:
尝试(并被拒绝)的行动:针对高市早苗
用户请求 ChatGPT 帮助策划针对日本首相高市早苗(因批评新疆人权状况)的影响力行动,包含 6 个方向:
1. 在网上放大负面评论
2. 伪造外国居民邮件,向日本政界投诉
3. 用假账号放大生活成本矛盾
4. 指控其右翼倾向
5. 借美国关税问题转移视线
6. 传播内蒙古"正面形象"
OpenAI 的模型拒绝了这个请求。但几周后,用户提交了该行动的进度报告,说明行动在没有 ChatGPT 的情况下已经继续推进。
验证到的真实活动
研究人员通过开源调查,验证了报告中描述的部分活动真实存在:
- 反高市标签 #右翼共生者 在 X/Pixiv/Blogspot 上传播(2025年10月)
- revealscum[.]com — 针对20+ 异见人士的"曝光网站"(OpenAI 2024年5月首次曝光,现确认与此账号相连)
- "李老师不是你老师" 李颖的骚扰活动有对应 X 账号足迹
- 惠波的 X 账号被限制,搜索时出现大量同名假账号
- Bluesky 上至少5个冒充惠波的账号,均于2024年12月5日同日创建
- 假讣告行动:在 X 上发布异见人士解志坚的假死亡消息(2023年8月,VoA 已报道)
规模数字(来自内部状态报告)
| 维度 | 数字 |
|---|---|
| 单省专职操作员 | 300+ |
| 覆盖境外平台 | 300+ |
| 运作战术 | 100+ 种 |
| 中国内网帖子 | 数百万 |
| 境外帖子 | 数万(包括50,000+帖子到200+西方平台) |
| 获得300+互动的帖子比例 | <150条(占比 <0.3%) |
使用的 AI 模型:DeepSeek-R1、Qwen2.5、YOLOv8(本地部署开源模型,而非 ChatGPT)
手段清单(部分)
- 大规模举报异见人士账号(附 AI 生成的"虚假截图证据")
- 伪装成美国移民官警告异见人士
- 伪造美国县法院文件提交给社交平台要求下架
- 创建大量与目标同名账号(Bluesky 预先占位战术)
- 线下骚扰:在异见人士家属附近张贴海报,拍照后在网上传播
- 伪造社交媒体截图当"证据"举报
3. 俄罗斯 Rybar:"Fish Food"
- 主 Telegram 频道 1.4M 订阅者
- 使用 ChatGPT 翻译、生成评论,然后由不同账号同步发布
- 一批生成的 7 条推文:观看量从 150,000 到 57 不等
- 关键发现:决定传播效果的是账号粉丝量,而非 AI 内容质量
- 已制定非洲选举干预计划,年度预算最高 $600,000
💡 关键结论
AI 的实际作用
> "We continue to see threat actors bolt AI onto old playbooks to move faster, not gain novel offensive capability from our models." — OpenAI
AI 在恶意行动中的实际用途:
- ✅ 翻译(中→英/西→英)
- ✅ 内容润色(让文字更"母语")
- ✅ 批量生成相似帖子
- ✅ 内部文档整理
- ❌ 没有带来新的进攻能力
- ❌ 无法突破社交平台的传播算法
为什么大多数行动效果很差?
1. 算法不认 AI 生成内容:同一批推文,有 150,000 次观看,有 57 次——差距来自账号粉丝量
2. 平台封号速度加快:反高市行动在头几天就有 ~200 个账号被各平台下架
3. 真实受众不买账:大多数 IO 内容只在操作者自己的网络内循环
OpenAI 的防御手段
- 封禁违规账号(2024年2月至今:40+ 网络)
- 与行业伙伴和政府机构共享情报
- 使用 AI 加速调查团队的排查工作
- 公开发布威胁报告(提高公众意识)
💡 与我们的关联
1. 对 AI 产品设计的启示
- 安全护栏有效:ChatGPT 成功拒绝了"策划针对外国政府首脑的影响力行动"请求。但没能阻止用户继续使用模型来润色已完成的行动报告。→ 护栏边界比人们想象的更难划清。
- 本地部署 AI 的威胁:中国威胁行为者主要使用本地部署的 DeepSeek/Qwen,不通过 OpenAI 的护栏。开源模型是监管盲区。
2. OpenClaw 相关
- 我们的 Agent 系统如果被滥用,可能成为类似的批量内容生成工具
- Cron + 消息系统 如果开放给陌生人,就是一个现成的"影响力行动工具包"
- → 白名单机制(authorized senders)的安全价值比想象的大
3. "行动效果 ≠ 行动规模"
报告最反直觉的发现:50,000 个帖子,<150 个获得互动。这对那些认为"AI 会让虚假信息问题爆炸性增长"的担忧提供了一些反驳——传播效果主要受账号可信度决定,而非内容量。
📊 评分
| 维度 | 评分(/10) |
|---|---|
| 信息密度 | 9.0 — 包含完整行动内部文件,非常罕见 |
| 可信度 | 9.5 — OpenAI 一手研究 + 开源验证 |
| 重要性 | 9.0 — 首次揭示中国"网络特战"完整内部架构 |
| 与我们的关联 | 7.5 — 对 AI 产品设计和安全有直接启示 |
| **综合** | **8.8** |
报告由深度研究助手自动生成 | 2026-03-16
来源: https://cdn.openai.com/pdf/df438d70-e3fe-4a6c-a403-ff632def8f79/disrupting-malicious-uses-of-ai.pdf