代号“精灵” 谷歌首次开放世界模型 AI加速进入“凭空造世”时代

3个月前 (01-31)财经热点6

  领域的进步可以看作一部交响乐,那么过去几年,乐章的主题无疑是“生成”——生成文字、图像、声音乃至视频。然而,在2026年初,一段崭新的旋律被奏响:它不仅生成,更能构建。

  北京时间1月30日凌晨,谷歌DeepMind向外部开放了Project Genie,它被认为是目前最先进的世界模型之一,可以算是世界模型Genie3的实验性研究原型,也是这套世界模型第一次以可交互形态对公众开放。

  “Genie”这个单词源于阿拉伯语 jinni(精灵),后经法语变形成 génie后成为一个英语词汇,最常见的含义是指阿拉伯和伊斯兰神话传说中,一个能实现召唤者愿望的“精灵”或“神怪”。谷歌DeepMind将其世界模型项目命名为“Project Genie”(精灵计划),正是在阐释该神话的内涵:这个AI模型能将你用文字描述的任何场景(召唤者的愿望),瞬间生成一个可以进入并交互的虚拟世界。

  当AI不仅能够描绘梦境,更能让人走进梦境并与之互动时,我们所讨论的“虚拟”与“现实”的边界,或许已到了需要被重新思考的时刻。

  目前,该原型率先向年满18岁的美国Google AI Ultra(3个月125美元)订阅用户开放。

  Project Genie的底层是世界模型Genie 3。与OpenAI的Sora等内容生成大模型不同,它的功能不局限于多模态内容生成(比如AI视频生成工具可为用户创作一段影片,模型可依据、参考的一切数据来自人类储存好的文字库、图像库及视频库),而是可以生成一个完整的空间,实现“凭空造世”:

  只需用文字描述一个场景或上传一张图片,例如“一座被巧克力河环绕的棉花糖城堡”,一个实时的、可交互的3D虚拟世界便会在几秒钟内生成。

  周围的环境则根据视角和行为动态、连续地生成。这并非依赖传统的引擎解码固定数据,而是对潜在物理规律与空间逻辑的一次即时推演与具现,能在用户移动时,实时生成前方的路径和环境。

  谷歌DeepMind在诸如国际象棋、围棋等特定环境的AI智能体研发上已有深厚积累,但要实现通用(AGI),系统必须能够理解和应对现实世界近乎无限的复杂性与多样性。

  Genie 3正是在这一方向上迈出的关键一步。它提供了一种前所未有的模拟能力,能够生成任何现实或虚构场景的交互式环境。这为机器人技术、动画制作乃至历史场景的虚拟探索等领域提供了强大的工具。

  对于AI的发展而言,Project Genie的深意远不止于炫酷的体验。它最核心的价值,在于为(及未来的)提供了一个无限、安全且成本可控的“模拟训练场”、“试错沙盒”。智能体可以在Genie创造的海量、多样化的模拟环境中进行学习和训练,理解现实世界的物理规则和因果逻辑,这正是迈向通用不可或缺的基石。

  从这个角度看,世界模型并非一个内容端的创作工具,而是一座连接当前AI与未来“具身智能”的桥梁财经热点,是让AI学会“常识”与“因果”的关键基础设施。

  人工智能先驱们几乎一致认为,世界模型对打造下一代人工智能至关重要。许多人表示,该技术终将助力创造超越人类的AGI。

  斯坦福大学教授、人工智能“教母”李飞飞创立了世界模型初创公司World Labs,据知情人士本月透露,“AI教母”李飞飞正与投资者展开新一轮洽谈,该公司最新估值有望达到约50亿美元;早些时候的消息显示,“AI教父”杨立昆的世界模型初创公司AMI Labs在一轮融资中吸引了包括Cathay Innovation在内的潜在支持者,该轮融资可能使这位前Meta首席人工智能科学家的公司估值达到35亿美元;英伟达CEO黄仁勋早早表态,世界模型能助力实现“物理人工智能”,自主操控、自动驾驶汽车等设备;Meta的超级智能AI实验室与机器人团队合作,正是为了构建世界模型,通过模拟现实世界物理规律,为机器人提供空间感知和精细操作能力,弥补现有机器人的不足……

  当然,作为初期成果,Project Genie为代表的世界模型仍非常不成熟。以Project Genie为例,该模型每次生成和探索的时间被严格限定在60秒以内,生成的世界在物理效果上可能不够逼真,有时无法精确遵循提示词或现实世界的物理定律,角色的操控也时常出现延迟或响应不精确的问题。此外,一些在早期演示中提及的高级功能,如通过即时指令改变世界事件,尚未在此版本中实现。

  这些限制部分源于世界模型巨大的计算消耗,这也是当前AI模型技术面临的核心矛盾。DeepMind的研究人员坦言,用户每使用一次,背后都有一块专用的计算芯片为其服务。每一次看似轻松的“造世”,背后都依赖专用计算芯片的全功率运转。这决定了它在现阶段,更像一扇仅供窥探未来的窄窗,而非可以随意出入的大门。

  谷歌DeepMind、World Labs等领先的AI团队都认为,世界模型可能会首先重塑游戏、影视行业。

  传统的3D资产创建与场景搭建是人力与时间密集型的核心环节。Project Genie展示的可能性是,将部分前期概念设计、场景原型构建乃至动态分镜预览的过程,压缩至几分钟甚至几秒钟。这并非要取代专业的创作引擎,而是可能重塑创作流程的起点,极大地释放创意验证的速度。

  DeepMind世界模型项目Genie 3的联合负责人Shlomi Fruchter此前表示:“软件开发,尤其是游戏开发,正在发生巨大变化,我预计在未来几年,这种变化甚至可能是彻底性的。”

  去年年底,World Labs正式推出了其首款商业产品、由生成式AI驱动的三维世界生成系统Marble。李飞飞表示,这项技术将影响Unity和Epic旗下Unreal等游戏引擎,“这一切都将被颠覆,模拟类游戏引擎确实到了该升级的时候了。”代号“精灵” 谷歌首次开放世界模型 AI加速进入“凭空造世”时代

“代号“精灵” 谷歌首次开放世界模型 AI加速进入“凭空造世”时代” 的相关文章

天合光能2025年预亏65亿元—75亿元 海外储能业务出货量快速增长

  (688599)披露2025年年度业绩预告。经财务部门初步测算,公司预计2025年年度实现归属于母公司所有者的净利润为-75亿元到-65亿元。预计实现扣非净利润为-79亿元到-69亿元...

中国电建1月20日快速上涨

  盘中快速上涨,5分钟内涨幅超过2%,截至14点01分财经热点,报6.31元,成交55.18亿元,换手率6.97%。中国电建1月20日快速上涨...

石基信息(002153)龙虎榜数据(01-20)

  不对因该资料全部或部分内容而引致的盈亏承担任何责任。用户个人对服务的使用承担风险,东方财富对此不作任何类型的担保。石基信息(002153)龙虎榜数据(01-20)...

中金:房地产政策端和供给侧初现积极变化

  中金研报认为,房地产政策端和供给侧初现积极变化。自2025年下半年以来,剔除季节性和同比基数影响后,一、二手房交易量整体呈低位走稳态势。在此基础上,供给侧出现一定积极变化,一方面是新供...

京泉华1月21日打开涨停

  盘中打开涨停,现报31.08元财经热点,成交10.15亿元,换手率14.84%。该股之前于10点43分涨停。京泉华1月21日打开涨停...

ST嘉澳1月21日盘中涨停

  盘中涨停,报115.23元,目前封单3691手,折合4253.14万元。截至目前,成交3.95亿元,换手率4.56%。ST嘉澳1月21日盘中涨停...