前言:现在国内各个互联网大厂在视频生成领域的竞争相当激烈,腾讯的代表作当属VideoCrafter系列了。从2022年的Make-A-Video开始,学术界对视频生成的共识是T2I模型提供内容生成能力,时间模块提供运动能力,视频生成的难点在于运动能力的学习。这一观点在AnimateDiff中达到顶峰。然而在VideoCrafter2在论文中通过大量的对比实验,证明了微调空间层的优越性。这篇博客详细介绍这篇腾讯视频生成的代表作。
目录
前言:现在国内各个互联网大厂在视频生成领域的竞争相当激烈,腾讯的代表作当属VideoCrafter系列了。从2022年的Make-A-Video开始,学术界对视频生成的共识是T2I模型提供内容生成能力,时间模块提供运动能力,视频生成的难点在于运动能力的学习。这一观点在AnimateDiff中达到顶峰。然而在VideoCrafter2在论文中通过大量的对比实验,证明了微调空间层的优越性。这篇博客详细介绍这篇腾讯视频生成的代表作。
目录