谷歌下个目标:让 AI 的能力不再参差,走向真实世界

用过 AI 的人都会有这种感受:它有时候很强,强到能做对奥数题目;它有时候又很弱,弱到答错小学生都会的问题。
用 AI,就像是在抽奖。这种随机性,让我们很难把握它在具体领域和任务上的能力边界。
这个问题,很少有人能讲明白,但 Google DeepMind 的联合创始人兼 CEO Demis Hassabis 绝对是其中之一。

他是这个时代 AI 领域最重要的人物之一,不仅是 AlphaGo 的缔造者,一位神经科学家,更是一位刚刚获得诺贝尔化学奖的跨界天才。
他认为,AI 发展的下一阶段,重点将不再是让语言模型变得更能言善辩,而是要走出纯粹的语言世界,进入一个能够理解物理现实、执行复杂任务、并推动科学发现的新纪元。
让我们跟着 Hassabis,寻找谷歌的答案。
参次不齐的智能现阶段的 AI,最致命的问题就是一半天才,一半白痴。Hassabis 把这种现象称为「锯齿状的智能」(Jagged Intelligence)。

翻译一下就是,能力参差不齐,分布不均。有些方面比人强,有些方面又不如人。
这种能力的「参差不齐」,是当前所有大语言模型共同的痛点。
谷歌 DeepMind 正在做的,就是想尽一些办法,消除这样的参差。
因为只有当 AI 的能力不再是「锯齿状」的,它才能真正地从数字世界走向物理世界,从一个语言模型进化为一个世界模型。
这,才是通往 AGI 的唯一路径。
从「大力出奇迹」到「认知架构」过去几年,AI 领域的主流叙事是「大力出奇迹」。也就是所谓的 Scaling Law:只要你堆更多的计算资源、喂更多的数据,模型的智能就会线性提升。
这种简单粗暴的逻辑催生了 GPT-3 和 GPT-4 的辉煌,也让整个行业陷入一种「算力为王」的迷思。
但「锯齿智能」的存在,给唯算力论泼了一盆冷水。
它揭示了一个残酷的事实:单纯的规模扩张,并不能带来可靠性。你得到的是一个更博学的「偏科生」,而不是一个融会贯通的「通才」。
它能记住你看过的几乎所有东西(System 1 的快速、直觉式思考),但它并不真正「理解」这些东西背后的逻辑和因果(System 2 的慢速、审慎式思考)。
作为一名神经科学家,Hassabis 很早就意识到,人类智能的强大之处不在于我们拥有一个巨大的、只会做模式匹配的神经网络,而在于我们具备审视、规划和验证自己思考过程的「元认知」能力。
我们不会因为看过所有菜谱就自动成为一个大厨,还需要在厨房里实践、试错、调整。
因此,DeepMind 的战略核心,就是从单纯的「堆料」转向对「认知架构」的重塑。
他们最新的旗舰模型 Gemini 3,其核心武器不再是更大的参数,而是一个名为「Deep Think」的机制。

这套机制,可以看作是为 AI 植入了一个初步的「System 2」。
当遇到复杂问题时,它不再是凭直觉自回归地吐出下一个词,而是会像一个严谨的科学家一样,在内部生成一个「思想树」,它会同时探索多条推理路径,评估每条路径的成功率,在发现此路不通时及时回溯,最后综合所有成功的路径,给出一个经过内部验证的答案。
这种在推理时投入更多计算资源的模式,本质上是在用算力换取「可靠性」。
从「副驾驶」到「任务控制中心」如果说「深度思考」是 AI 的新大脑,那么「智能体」 (Agent) 就是 AI 的新手脚。
Hassabis 说,AI 的未来在于「基于智能体的系统」。
我们正在经历一个从「Copilot (副驾驶)」时代,向「Agent-First (智能体优先)」时代的转变。
过去的 AI 编程工具,本质上是高级的「自动补全」。它坐在你的副驾驶座上,帮你写下一行行代码,但方向盘始终在你手里。
谷歌新推出的 Antigravity 的逻辑完全不同,它让开发者从一个「代码编写者」变成了一个「智能体架构师」。

在这个新的工作流里,你不再是盯着光标思考下一行代码怎么写,而是像一个工程经理一样,向多个并行的、异步工作的智能体下达指令:
这些智能体在后台独立工作,它们拥有自己的终端、文件系统和浏览器访问权限,去端到端地完成任务。它们不仅仅是「写」代码,它们会「规划」、「实现」、「调试」甚至「验证」自己的工作。
这种高度自治的工作流,核心要解决一个问题:信任。
当一个黑箱智能体告诉你「Bug 已经修复」,你如何相信它?难道要花同样的时间去人工验证一遍吗?
Antigravity 的解决方案是「产物」。智能体在工作过程中,会不断生成各种可供人类审查的「工作凭证」。
比如,在写代码之前,它会先生成一份详细的「实施计划」;在修复一个 UI Bug 后,它会提供一段自己操作浏览器、验证修复效果的「屏幕录像」。
开发者通过审查这些「产物」,就能以极高的效率对 AI 的工作进行引导和确认。
这不仅仅是生产力的提升,它预示着软件工程这个行业的价值中枢,正在从「语法熟练度」彻底迁移到「系统设计、需求定义和最终验证」上。
从「生成视频」到「生成世界」要彻底碾平「锯齿」,光有聪明的「大脑」和灵巧的「双手」还不够,AI 还需要一个能够理解物理世界的「身体」。
这就是谷歌的另一个杀手锏:Genie 3。

Genie 3 常常被误解为 OpenAI Sora 的竞品。
但实际上,Sora 生成的是一段线性的、不可交互的视频文件,而 Genie 3 生成的是一个可玩的、实时的、遵守物理规律的 3D 世界。
你可以把它理解成一个「AI 驱动的游戏引擎」。
你给 Genie 3 一张图片或一段文字,它能生成一个可以交互的场景。而且这个世界可以维持数分钟的「时空连贯性」。
你甚至可以用自然语言实时地改变这个世界,比如「现在开始下雨」或「让地面结冰」,整个世界的物理规律都会随之动态调整。
Genie 3 的意义远超游戏和娱乐,它为 AI 提供了一个完美的「训练场」。
比如,在现实世界中训练机器人成本高昂且充满危险,你不可能让一个机器人在真实的火灾现场里通过反复试错来学习逃生。
但在 Genie 3 生成的无数个虚拟世界里,DeepMind 的具身智能体项目 SIMA 可以进行亿万次的模拟训练,从而获得对物理世界的「常识」和「直觉」。
这是 AI 走向现实的关键一步。只有当 AI 不再仅仅从文本中「阅读」关于世界的信息,而是能在模拟世界中「体验」物理规律时,它的知识才算是真正「落地」了。
这种通过模拟来学习物理因果的能力,是碾平「锯齿智能」最坚实的地基。
终局:算力丰盈与科学发现那么,发展如此强大的 AI,最终是为了什么?
在 Hassabis 看来,AI 的「杀手级应用」,不是聊天,不是广告优化,而是科学发现。
他追求的,是一种由 AI 驱动的「极度丰裕」的未来——一个能源、健康、材料等领域的重大难题被 AI 加速解决,从而使人类社会进入后稀缺时代。
设计蛋白质的 AlphaProteo、预测新材料的 GNoME、等离子体模拟器 Torax…这些项目,才是 DeepMind 真正的皇冠明珠。
Gemini 的推理能力、Antigravity 的行动能力、Genie 的模拟能力,所有这些技术最终都将汇集于此,共同构成一个强大的「AI 科学家」。
谷歌所做的一切,都是为了打造一个没有「锯齿」的、可靠的、能够理解物理世界的通用智能。
因为只有这样的 AI,才能成为一个合格的科学研究伙伴,去探索人类知识的边界。
单纯依靠扩大规模就能获得巨大提升的阶段已经结束了,下一阶段的竞争,将是关于架构创新、系统设计和对现实世界的理解。
正如 Hassabis 所说,我们正在从「处理数据的软件」,迈向「处理现实的软件」。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。
