前言:Video-to-Video是视频生成中非常火的任务,也是最有应用价值的方向。图形学顶会SIGGRAPH 2023有一篇经典论文《Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation》,其中关键帧翻译、跨帧约束等方法值得我们借鉴。这篇博客详细解读一下这篇论文。
目录
贡献概述
本文提出了一种视频到视频翻译框架。核心步骤分成关键帧翻译和完整的视频翻译。第一部分使用自适应扩散模型生成关键帧,并应用分层跨帧约束来强制形状、纹理和颜色的一致性。第二部分通过时间感知补丁匹配和帧混合将关键帧传播到其他帧。
具体来说,作者使用以下四种方法: