前言:前段时间谷歌发布了基于LLMs的视频生成模型VideoPoet,这种信仰Transformers的做法就很Google。大家都以为2024年视频生成会是LLMs和SD两条路线之争,但是谷歌很快就发布了基于SD的视频生成模型Lumiere,这波直接偷家了?这篇博客详细解读Lumiere的改进点和带给我们的启示。
目录
贡献概述
与现有的远距离关键帧和时间超分辨率的视频生成模型相比,他们都是一种本质上难以实现全局时
前言:前段时间谷歌发布了基于LLMs的视频生成模型VideoPoet,这种信仰Transformers的做法就很Google。大家都以为2024年视频生成会是LLMs和SD两条路线之争,但是谷歌很快就发布了基于SD的视频生成模型Lumiere,这波直接偷家了?这篇博客详细解读Lumiere的改进点和带给我们的启示。
目录
与现有的远距离关键帧和时间超分辨率的视频生成模型相比,他们都是一种本质上难以实现全局时