Yann LeCun创立的AMI Labs获10.3亿美元融资,引领世界模型(World Models)先锋

#引言
人工智能领域正在经历一场由架构引发的地震。过去几年里,像GPT-4和Claude这样的自回归大语言模型(LLMs)完全主导了话题。但一场根本性的颠覆即将来临。由AI先驱、图灵奖得主Yann LeCun领衔的AMI Labs刚刚宣布了一轮高达10.3亿美元的巨额融资。他们的使命是什么?构建能够突破当前生成式AI局限的“世界模型(World Models)”。
在Ichiban Tools,我们始终关注开发者技术的前沿。虽然我们致力于为当下的工程挑战构建实用的工具,但理解未来的架构演进同样至关重要。让我们深入探讨AMI Labs正在构建什么,世界模型的底层技术是什么,以及为什么这场十亿美元的赌注可能会重新定义机器智能。
#发生了什么:押注目标驱动型AI的十亿美元
据TechCrunch报道,AMI Labs已获得10.3亿美元的早期融资。这笔巨额资本注入凸显了在自回归LLM能力被认为遇到瓶颈后,业界对“下一个大事件”日益增长的渴望。
多年来,LeCun一直直言不讳地批评纯粹的自回归方法,他认为仅仅预测下一个Token根本不足以实现人类水平的推理或真正的通用人工智能(AGI)。相反,他的研究——以及现在AMI Labs的商业重点——一直集中在目标驱动型AI(Objective-Driven AI)以及学习现实世界物理规律和底层逻辑的架构上。
这笔庞大的种子轮/A轮融资将用于建设大规模训练这些新型架构所需的巨大算力集群,推动它们从引人注目的研究论文走向可供企业部署的基础模型(Foundational Models)。
#为什么这很重要:逃离“自回归陷阱”
要理解AMI Labs的意义,我们必须批判性地审视当前LLM架构的局限性:
- 设计缺陷导致的幻觉(Hallucinations by Design): 因为LLM是基于训练数据频率进行统计性文本生成的,它们缺乏一个底层的、基于现实的世界模型。它们不“知道”事实,只知道词汇之间的关联性。
- 规划能力的缺失(The Planning Deficit): 自回归模型是从左到右线性生成答案的。在面对需要回溯、层级推理或模拟多个未来状态的复杂多步规划时,它们显得力不从心。
- 样本效率低下(Sample Inefficiency): 人类学习物理世界运作规律所需的数据量惊人地少(例如,蹒跚学步的孩子很快就会知道没有支撑的物体会掉落)。而LLM却需要数万亿个Token仅仅去逼近常识,这使得它们成为效率极低的“学习者”。
世界模型旨在解决这些根本性的缺陷。世界模型是一个环境的内部数学表征,它允许AI系统在采取行动之前预测其后果。你可以把它想象成一个运行在AI架构内部的物理模拟引擎,而不是一个高度高级的自动补全工具。
#技术启示:从Token到抽象表征
AMI Labs背后的核心技术很可能会严重依赖JEPA(联合嵌入预测架构,Joint Embedding Predictive Architecture)和基于能量的模型(Energy-Based Models, EBMs)等架构。以下是这种范式与开发者目前使用的基于Transformer的LLM有何不同的技术解析。
#自回归范式(现状)
当前的模型接收一个Token序列,对其进行编码,并预测下一个Token的概率分布。
x_t+1 = Model(x_0, x_1, ..., x_t)
在这种范式中,错误会随着时间呈指数级累积。如果一个10步推理过程中的第3步出现轻微偏差,模型无法回溯;剩下的输出将是致命的错误。
#JEPA范式(未来)
JEPA不是直接预测缺失的像素或文本Token(这迫使模型在不相关的高频噪声上浪费算力),而是预测缺失数据的抽象表征。
- 编码上下文(Encode the Context): 将已知数据(例如,视频的前半部分或一个复杂状态)通过编码器,得到一个抽象的数学表征。
- 预测未来表征(Predict the Future Representation): 使用预测网络,在给定特定提议动作的情况下,计算未来状态的表征。
- 在抽象空间中比较(Compare in Abstract Space): 损失函数是在嵌入空间(Embedding Space)中计算的,而不是在原始数据空间中计算的。
这使得模型能够忽略不可预测的、不相关的细节(比如池塘涟漪的确切纹理),而纯粹关注宏观逻辑(石头砸进水里并引起了扰动)。
#基于能量的模型(EBMs)
LeCun的愿景中占据重要地位的是EBM。在EBM中,系统试图找到一个最小化数学“能量”函数的状态,该函数衡量了上下文与提议答案或计划之间的兼容性。这与概率性地对Token进行采样有着本质的不同;这是一个复杂的优化过程,允许真正的推理、自我纠错和针对目标进行规划。
#开发者下一步该怎么做?
从LLM到世界模型的过渡不会一蹴而就,但AMI Labs这10.3亿美元的巨额资金储备显著加速了这一进程。以下是工程师和开发者应该准备的:
- API范式的转变: 我们将不再看到简单的
prompt-in、text-out端点,取而代之的可能是需要我们传入初始状态和特定目标的API。模型将运行内部模拟,并返回一个经过验证的计划或一系列有保证的行动。 - 多模态成为默认配置: 世界模型本质上依赖于各种数据(视频、空间数据、运动学)来理解物理规律和逻辑。纯文本不足以训练真正的世界模型。未来的API将把多模态输入作为标准。
- 真正的自主智能体(Autonomous Agents): 目前的“AI智能体”通常是围绕LLM调用构建的脆弱的
while循环。凭借其天生的规划、模拟结果和回溯能力,世界模型将成为真正可靠的自主智能体的引擎,能够执行长时间运行的软件工程或数据任务。
#结语
Yann LeCun的AMI Labs插下了一面价值十亿美元的旗帜,标志着仅仅通过扩大Transformer参数规模的时代正在让位于必要的架构转型。对于开发者社区来说,这意味着我们今天构建的工具、抽象和应用程序需要在未来几年内快速演进。
在Ichiban Tools,我们将密切关注这些进展。随着世界模型通过API和开源权重(open-weights)变得触手可及,我们将准备好把它们确定性的规划能力整合到下一代开发者工具中。通往功能性AGI的竞赛刚刚经历了一次巨大的结构性转变,工程上的可能性比以往任何时候都更加激动人心。