Yann LeCun创立的AMI Labs获10.3亿美元融资，引领世界模型（World Models）先锋

Hero

#引言

人工智能领域正在经历一场由架构引发的地震。过去几年里，像GPT-4和Claude这样的自回归大语言模型（LLMs）完全主导了话题。但一场根本性的颠覆即将来临。由AI先驱、图灵奖得主Yann LeCun领衔的AMI Labs刚刚宣布了一轮高达10.3亿美元的巨额融资。他们的使命是什么？构建能够突破当前生成式AI局限的“世界模型（World Models）”。

在Ichiban Tools，我们始终关注开发者技术的前沿。虽然我们致力于为当下的工程挑战构建实用的工具，但理解未来的架构演进同样至关重要。让我们深入探讨AMI Labs正在构建什么，世界模型的底层技术是什么，以及为什么这场十亿美元的赌注可能会重新定义机器智能。

#发生了什么：押注目标驱动型AI的十亿美元

据TechCrunch报道，AMI Labs已获得10.3亿美元的早期融资。这笔巨额资本注入凸显了在自回归LLM能力被认为遇到瓶颈后，业界对“下一个大事件”日益增长的渴望。

多年来，LeCun一直直言不讳地批评纯粹的自回归方法，他认为仅仅预测下一个Token根本不足以实现人类水平的推理或真正的通用人工智能（AGI）。相反，他的研究——以及现在AMI Labs的商业重点——一直集中在目标驱动型AI（Objective-Driven AI）以及学习现实世界物理规律和底层逻辑的架构上。

这笔庞大的种子轮/A轮融资将用于建设大规模训练这些新型架构所需的巨大算力集群，推动它们从引人注目的研究论文走向可供企业部署的基础模型（Foundational Models）。

#为什么这很重要：逃离“自回归陷阱”

要理解AMI Labs的意义，我们必须批判性地审视当前LLM架构的局限性：

设计缺陷导致的幻觉（Hallucinations by Design）： 因为LLM是基于训练数据频率进行统计性文本生成的，它们缺乏一个底层的、基于现实的世界模型。它们不“知道”事实，只知道词汇之间的关联性。
规划能力的缺失（The Planning Deficit）： 自回归模型是从左到右线性生成答案的。在面对需要回溯、层级推理或模拟多个未来状态的复杂多步规划时，它们显得力不从心。
样本效率低下（Sample Inefficiency）： 人类学习物理世界运作规律所需的数据量惊人地少（例如，蹒跚学步的孩子很快就会知道没有支撑的物体会掉落）。而LLM却需要数万亿个Token仅仅去逼近常识，这使得它们成为效率极低的“学习者”。

世界模型旨在解决这些根本性的缺陷。世界模型是一个环境的内部数学表征，它允许AI系统在采取行动之前预测其后果。你可以把它想象成一个运行在AI架构内部的物理模拟引擎，而不是一个高度高级的自动补全工具。

#技术启示：从Token到抽象表征

AMI Labs背后的核心技术很可能会严重依赖JEPA（联合嵌入预测架构，Joint Embedding Predictive Architecture）和基于能量的模型（Energy-Based Models, EBMs）等架构。以下是这种范式与开发者目前使用的基于Transformer的LLM有何不同的技术解析。

#自回归范式（现状）

当前的模型接收一个Token序列，对其进行编码，并预测下一个Token的概率分布。 x_t+1 = Model(x_0, x_1, ..., x_t)

在这种范式中，错误会随着时间呈指数级累积。如果一个10步推理过程中的第3步出现轻微偏差，模型无法回溯；剩下的输出将是致命的错误。

#JEPA范式（未来）

JEPA不是直接预测缺失的像素或文本Token（这迫使模型在不相关的高频噪声上浪费算力），而是预测缺失数据的抽象表征。

编码上下文（Encode the Context）： 将已知数据（例如，视频的前半部分或一个复杂状态）通过编码器，得到一个抽象的数学表征。
预测未来表征（Predict the Future Representation）： 使用预测网络，在给定特定提议动作的情况下，计算未来状态的表征。
在抽象空间中比较（Compare in Abstract Space）： 损失函数是在嵌入空间（Embedding Space）中计算的，而不是在原始数据空间中计算的。

这使得模型能够忽略不可预测的、不相关的细节（比如池塘涟漪的确切纹理），而纯粹关注宏观逻辑（石头砸进水里并引起了扰动）。

#基于能量的模型（EBMs）

LeCun的愿景中占据重要地位的是EBM。在EBM中，系统试图找到一个最小化数学“能量”函数的状态，该函数衡量了上下文与提议答案或计划之间的兼容性。这与概率性地对Token进行采样有着本质的不同；这是一个复杂的优化过程，允许真正的推理、自我纠错和针对目标进行规划。

#开发者下一步该怎么做？

从LLM到世界模型的过渡不会一蹴而就，但AMI Labs这10.3亿美元的巨额资金储备显著加速了这一进程。以下是工程师和开发者应该准备的：

API范式的转变： 我们将不再看到简单的prompt-in、text-out端点，取而代之的可能是需要我们传入初始状态和特定目标的API。模型将运行内部模拟，并返回一个经过验证的计划或一系列有保证的行动。
多模态成为默认配置： 世界模型本质上依赖于各种数据（视频、空间数据、运动学）来理解物理规律和逻辑。纯文本不足以训练真正的世界模型。未来的API将把多模态输入作为标准。
真正的自主智能体（Autonomous Agents）： 目前的“AI智能体”通常是围绕LLM调用构建的脆弱的while循环。凭借其天生的规划、模拟结果和回溯能力，世界模型将成为真正可靠的自主智能体的引擎，能够执行长时间运行的软件工程或数据任务。

#结语

Yann LeCun的AMI Labs插下了一面价值十亿美元的旗帜，标志着仅仅通过扩大Transformer参数规模的时代正在让位于必要的架构转型。对于开发者社区来说，这意味着我们今天构建的工具、抽象和应用程序需要在未来几年内快速演进。

在Ichiban Tools，我们将密切关注这些进展。随着世界模型通过API和开源权重（open-weights）变得触手可及，我们将准备好把它们确定性的规划能力整合到下一代开发者工具中。通往功能性AGI的竞赛刚刚经历了一次巨大的结构性转变，工程上的可能性比以往任何时候都更加激动人心。