当AI与游戏碰撞,会擦出怎样的火花呢?
最近,谷歌DeepMind的一项研究——GameNGen,就为我们展现了AI在游戏领域前所未有的可能性。
AI驱动的实时游戏引擎
GameNGen,是由谷歌DeepMind研发的实时游戏引擎。
利用先进的扩散模型,能够在单个谷歌TPU上以每秒20帧的速度实时生成经典射击游戏DOOM(毁灭战士)的画面。
不同于传统的游戏,GameNGen在你进入一道门之前,门后的内容尚未生成。
而游戏画面的质量,甚至能与事先存储的场景相媲美,人类评估者难以分辨真伪,操作转换流畅自如。
核心技术:扩散模型
在训练过程中,首先通过强化学习Agent来玩游戏,记录下所有的操作、技能和观察数据,形成第二阶段的训练数据集。
为使生成的游戏行为更加贴近人类,研究者设计了一个奖励函数,根据游戏中的特定情况(如被击中、消灭敌人、捡起物品等)分配分数。
基于预训练的Stable Diffusion v1.4,GameNGen预测下一帧,将过去的帧序列和动作作为条件输入。
通过一系列创新技术,如噪声增强和微调自编码器的解码器部分,有效解决了自回归生成中的误差累积问题,显著提高了图像质量。
人类难以分辨的AI生成画面
实验结果显示,GameNGen在图像质量评估上表现出色,无论是基于感知的图像相似度度量LPIPS还是衡量图像质量的PSNR,均达到了较高标准。
在短时轨迹上,人类评估者几乎无法区分模拟画面与实际游戏画面。
未来游戏行业的革命
GameNGen的出现,无疑为游戏行业带来了新的变革。
虽然有人质疑其是否真正能替代传统游戏引擎,但不可否认的是,GameNGen为游戏开发提供了全新的技术路径,未来或许能为尚未存在的游戏生成数据,创造全新的游戏体验。
在专业开发者和3D创作引擎的协作下,消费者将能体验从文本直接创造游戏或虚拟世界的全新方式,开启游戏行业的无限可能。