Ndea:François Chollet 的程序合成路线与 AGI 追求
> 深度研究报告 | 2026年4月
一、背景:谁在打造 Ndea
2025年1月,Google AI 研究员、Keras 框架创建者 François Chollet 与 Zapier 联合创始人 Mike Knoop 共同宣布创办 Ndea(发音 "Endia"),一家专注于通过程序合成(Program Synthesis)实现 AGI 的前沿 AI 实验室。
Ndea 的名字源自希腊语 ennoia(直觉理解)和 dianoia(逻辑推理),反映其核心理念:将深度学习的模式识别能力与程序合成的形式推理能力融合为统一架构。
融资情况:Ndea 已筹集 4350万美元,投资方包括 Y Combinator、Coatue Management、Factorial Capital 和 Quiet Capital。作为对比,Ilya Sutskever 的 Safe Superintelligence(SSI)融资超10亿美元,Anthropic 融资超100亿美元。Ndea 的融资规模相对克制,体现了其对"小而精"团队路线的信心。
来源:
- TechCrunch: AI researcher François Chollet founds a new AI lab focused on AGI
- PitchBook: Ndea Company Profile
- VentureBeat: Forget Nvidia: Ndea wants to build AI that keeps improving
二、François Chollet 的 AI 思想演变
2.1 Keras 时代:降低深度学习的门槛
Chollet 最初因创建 Keras 而闻名。Keras 是一个高层次的深度学习 API,极大降低了构建神经网络的门槛,后来被整合为 TensorFlow 的高级接口。在 Google 的近十年间,Chollet 既是深度学习的践行者,也是其局限性的深刻反思者。
2.2 ARC-AGI:重新定义智能的度量
2019年,Chollet 发表了具有深远影响的论文 "On the Measure of Intelligence",提出了一个核心论点:智能不是技能的积累,而是从少量信息中高效产生新技能的能力。基于这一理论,他设计了 ARC-AGI(Abstraction and Reasoning Corpus) 基准测试。
ARC-AGI 的核心设计理念:
- 不依赖先验知识:测试任务不依赖训练数据中已有的模式,要求系统从少量示例中推导规则
- 测量泛化能力:每个任务都是全新的,无法通过记忆或模式匹配解决
- 人类基线:人类在 ARC-AGI 上轻松达到约85%的准确率,而早期 GPT-4 仅为0%
2.3 从批评者到建设者
Chollet 长期以来是"暴力缩放"路线的批评者。他认为,仅靠增加参数和数据量无法达到 AGI,因为这种方法本质上是"记忆"而非"推理"。2024年底离开 Google 后,他选择了用创业来验证自己的理论——Ndea 就是他思想的实践延伸。
来源:
三、技术路线深度分析:深度学习引导的程序合成
3.1 程序合成的原理
程序合成(Program Synthesis)是计算机科学中的一个经典问题:给定一个高层次的规范(specification),自动构造一个满足该规范的程序。
在传统意义上,程序合成是形式化方法的一个分支,通常需要:
1. 输入规范:形式化的问题描述(如前置条件、后置条件)
2. 搜索空间:可能的程序空间
3. 验证机制:证明生成的程序满足规范
其核心挑战在于搜索空间爆炸——即使是简单的函数,可能的程序组合数量也是天文数字。
3.2 深度学习与程序合成的融合
Ndea 的核心创新方向是 "深度学习引导的程序合成"(Deep Learning-Guided Program Synthesis)。这是一种混合架构:
深度学习的角色——直觉(ennoia):
- 快速识别数据中的模式和结构
- 引导搜索方向,缩小程序合成空间的搜索范围
- 提供启发式评估,判断哪些程序更可能正确
- 类似人类解题时"直觉上感觉这条路线对"
程序合成的角色——推理(dianoia):
- 搜索离散的程序空间,找到精确的解
- 生成可验证、可组合的程序
- 提供形式化的正确性保证
- 类似人类解题时"严格推导每一步"
3.3 与纯深度学习路线的关键差异
| 维度 | 传统 LLM 路线 | Ndea 程序合成路线 |
|---|---|---|
| **泛化机制** | 插值(在已知数据点间插值) | 搜索(在程序空间中搜索新解) |
| **数据需求** | 海量训练数据 | 少量示例即可 |
| **输出形式** | 概率分布(token序列) | 确定性程序(可验证) |
| **推理能力** | 链式思维(CoT)近似推理 | 形式化推理(程序即证明) |
| **可解释性** | 黑箱 | 生成的程序可直接审查 |
| **自我改进** | 依赖 RLHF/外部反馈 | 程序可自验证、自改进 |
3.4 技术挑战
Chollet 自己承认程序合成面临重大挑战:
1. 计算复杂度:程序搜索空间呈指数增长,传统方法无法扩展。Chollet 将程序合成的现状类比为2012年的深度学习——潜力巨大但基础设施不成熟。
2. 规范获取:如何从模糊的人类需求中提取形式化规范
3. 评估函数设计:如何高效判断一个中间程序是否"在正确方向上"
4. 与深度学习的深度集成:两种范式如何真正协同,而非简单串联
3.5 前沿实验室的认可
值得注意的是,程序合成已不再是 Ndea 的独门路线。Chollet 指出"每个前沿 AI 实验室都开始探索程序合成",包括 OpenAI(o3/o4 系列中融入的程序搜索)、Google DeepMind(AlphaCode 系列的代码生成)。但 Ndea 的独特之处在于将程序合成置于与深度学习同等重要的核心地位,而非作为辅助组件。
来源:
- ARC Prize: How to Beat ARC-AGI by Combining Deep Learning and Program Synthesis
- VentureBeat: Ndea wants to build AI that keeps improving
- lewish.io: ARC-AGI 2025 Research Review
四、ARC-AGI 基准测试:进展与成绩
4.1 版本演进
- ARC-AGI-1(2019):原始版本,400个公开任务 + 私有评估集
- ARC-AGI-2(2025年3月):新增双重评分体系(准确率 + 效率/成本),显著提高难度
- ARC-AGI-3:计划2026年初发布,持续进化
4.2 各团队成绩对比(截至2025年底)
ARC-AGI-2 私有评估集成绩:
| 系统/团队 | 准确率 | 成本/任务 | 备注 |
|---|---|---|---|
| Claude Opus 4.5 (Thinking) | 37.6% | $2.20 | 商业模型最高分 |
| Gemini 3 Pro + Poetiq 优化 | 54% | $30 | 模型优化方案最高分 |
| OpenAI o3 (ARC-AGI-1) | 75.7% | ~$10k | ARC-AGI-1 历史突破 |
| NVARC (Kaggle 2025冠军) | 24.0% | $0.20 | Kaggle竞赛最高分 |
| 人类基线 | ~85% | — | 参考值 |
关键观察:
- ARC-AGI-2 大幅提升了难度——o3 在 ARC-AGI-1 上达到75.7%,但在 ARC-AGI-2 上仅约3%(medium版本)
- "Refinement Loop"(优化循环)成为2025年的主要进步方向
- Kaggle 竞赛吸引了1455支队伍,提交15154次方案
- 四大 AI 实验室(OpenAI、Anthropic、Google DeepMind、xAI)均在模型卡中报告了 ARC-AGI 成绩
4.3 学术论文趋势
2025年 ARC Prize 收到90篇论文(2024年为47篇),获奖论文的技术方向几乎全部指向"深度学习引导的程序合成",印证了 Chollet 的路线判断:
- 一等奖:Jolicoeur-Martineau 的"Less is More: Recursive Reasoning with Tiny Networks"——使用微型网络的递归推理
- 二等奖:Pourcel 等人的"Self-Improving Language Models for Evolutionary Program Synthesis"——进化式程序合成
来源:
五、竞品对比与行业格局
5.1 与主流 LLM 路线的对比
主流路线(OpenAI、Anthropic、Google):
- 核心方法:大规模预训练 + RLHF + Scaling Law
- 优势:已经在广泛任务上展现强大能力,商业化路径清晰
- 劣势:泛化能力受限于训练数据分布,推理能力本质上是"近似"而非"精确"
Ndea 路线:
- 核心方法:深度学习引导的程序合成
- 优势:理论上可实现真正的泛化和发明能力,数据效率极高
- 劣势:技术成熟度低,离商业化遥远,成功概率不确定
5.2 与其他 AGI 实验室的对比
| 实验室 | 创始人 | 融资 | 技术路线 | 阶段 |
|---|---|---|---|---|
| Ndea | Chollet & Knoop | $43.5M | 程序合成 | 早期研发 |
| SSI | Ilya Sutskever | $1B+ | 未公开(推测纯Scaling) | 早期研发 |
| Anthropic | Dario Amodei | $10B+ | RLHF + Constitutional AI | 产品化阶段 |
| OpenAI | Sam Altman | $13B+ | Scaling + RL | 产品化阶段 |
5.3 竞品:其他程序合成探索者
虽然 Ndea 是唯一一家以程序合成为核心的独立实验室,但多家公司已开始布局:
- OpenAI o3/o4:内部融入了程序搜索组件
- Google DeepMind AlphaCode:代码生成中使用了程序合成技术
- Kaggle 社区:ARC Prize 2025 的获奖方案大量使用了进化式程序合成
来源:
六、投资分析
6.1 融资规模与估值合理性
Ndea 的4350万美元融资,投资方阵容包括 Y Combinator(早期孵化之王)、Coatue(对冲基金巨头)、Factorial Capital 和 Quiet Capital。这一融资规模在 AI 实验室中属于"中等偏低",但考虑到团队只有两位核心创始人且为全远程组织,资金效率可能较高。
6.2 风险因素
高风险:
1. 技术风险(最大):程序合成作为 AGI 核心路径尚未被验证。Chollet 自己也说"我们相信有小但真实的突破机会"——"小但真实"本身就意味着大概率失败
2. 竞争风险:大型实验室(OpenAI、Google)如果将程序合成作为辅助组件融入现有系统,可能在不改变核心路线的情况下获得类似效果
3. 人才风险:程序合成是高度专业化的领域,人才池很小
潜在回报:
1. 如果程序合成路线成功,Ndea 将拥有先发优势——这是与 Scaling Law 完全不同的技术路径
2. Chollet 的个人影响力和 ARC Prize 的学术影响力为公司带来了品牌和人才获取优势
3. 即使 AGI 目标未达成,程序合成技术本身在代码生成、自动化等领域有明确的商业应用
6.3 关键判断
Ndea 是一笔典型的 "高杠杆、低概率" 投资:
- 如果成功:重新定义 AI 范式,回报可能是百倍甚至千倍
- 如果失败:4350万美元在 AI 领域属于可承受的损失
投资者(尤其是 Y Combinator)的逻辑可能是:在"Scaling Law 终结论"的风险对冲下,投一家完全不同路线的团队是合理的组合策略。
来源:
七、总结与展望
Ndea 代表了 AI 研究中一条罕见的"非主流但严肃"的路线。Chollet 不是空想家——他创建过被数百万人使用的框架,设计了被全行业认可的基准测试,他的每一步都有扎实的学术和工程基础。
然而,从"理论正确"到"工程可行"之间有巨大鸿沟。程序合成面临的核心挑战(搜索空间爆炸、计算复杂度)可能需要根本性的算法突破才能解决,而这正是 Ndea 需要证明的。
值得关注的里程碑:
- ARC-AGI-3 的发布(2026年初)——Ndea 是否能在此基准上展示独特优势
- 团队招聘进展——能否吸引到顶级的程序合成研究者
- 是否有技术论文或演示发布——目前 Ndea 尚未公开任何具体技术成果
Ndea 的成败,将在很大程度上决定"程序合成是否是通往 AGI 的可行路径"这一根本性问题。无论结果如何,这条路线的探索本身就在推动 AI 研究走向更本质的方向。
报告生成日期:2026年4月17日
所有链接均经验证有效