编译/VR陀螺
Genie 3是一款“能生成多样化交互环境的通用世界模型”。谷歌现已通过Project Genie向美国AI Ultra订阅用户开放该模型。
世界模型可模拟环境动态,预测其演变过程及行为影响。尽管谷歌DeepMind在国际象棋、围棋等特定领域拥有丰富经验,但构建通用人工智能需要能够驾驭现实世界多样性的系统。

该实验性研究原型要求用户描述环境(“你的世界是什么样子的?”),包括探索方式——步行、骑行、飞行、驾驶等——以及第一/第三人称视角。在指定角色类型(“是人类、动物、物体还是其他形态?”)后,Project Genie将通过Nano Banana Pro生成预览图像(即“世界草图”)。这使用户能在进入世界前预览环境形态,并通过调整图像精细化设定世界细节。
随后进入“创建世界”阶段,用户每次操作限时60秒。这些逼真世界以720p分辨率呈现,交互帧率达每秒20-24帧。移动时,Genie 3会“根据你的动作实时生成前方路径”。谷歌通过“突破性一致性”技术模拟物理特性与交互效果。用户可在探索世界时调整视角,并能下载全程漫游视频。
另一项功能支持生成式世界重新组合:基于现有提示词重构世界,创造全新诠释。还可在画廊或<随机生成器图标>中探索精选世界获取灵感,或直接基于现有世界进行创作。
来源:9to5google
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息