本文是LLM系列文章,针对《DIFFUSION MODELS ARE REAL-TIME GAME ENGINES》的翻译。
摘要
我们介绍GameNGen,这是第一个完全由神经模型驱动的游戏引擎,它能够在长轨迹上与复杂环境进行高质量的实时交互。GameNGen可以在单个TPU上以每秒超过20帧的速度交互式模拟经典游戏DOOM。下一帧预测的PSNR为29.4,与有损JPEG压缩相当。人类评分员在区分游戏短片和模拟短片方面只比随机机会好一点。GameNGen的训练分为两个阶段:(1)RL代理学习玩游戏并记录训练过程,(2)训练扩散模型以产生下一帧,条件是过去帧和动作的顺序。调节增强可以在长轨迹上实现稳定的自回归生成。
1 引言
2 交互式世界模拟
3 GAMENGEN
4 实验设置
5 结果
6 相关工作
7 讨论
总结。我们介绍了GameNGen,并证明了在神经模型上以每秒20帧的速度进行高质量的实时游戏是可能的。我们还提供了一个将交互式软件(如