【CVPR 2023】解读LFDM:Conditional Image-to-Video Generation with Latent Flow Diffusion Models

LFDM是一种新的潜在流扩散模型,用于条件图像到视频生成,通过潜在空间中的流序列合成时间连贯的运动。它采用两阶段训练,包括潜在流自动编码器和扩散模型,提高了视频合成效率。LFDM在多个数据集上表现优越,尤其适用于面部表情、人类行为和手势的视频生成。
摘要由CSDN通过智能技术生成

Diffusion Models视频生成-博客汇总

前言:LFDM通过流预测器分解latent和mask映射到flow域,大幅度降低了视频合成的成本,并且是为数不多的image-to-video的工作,很多做法非常值得借鉴,这篇博客重点讲解一下这篇文章《Conditional Image-to-Video Generation with Latent Flow Diffusion Models》。

目录

贡献概述

方法详解

第一阶段:潜在流自动编码器

第二阶段:扩散模型

论文和代码

个人感悟


贡献概述

LFDM 充分利用给定图像的空间位置并根据生成的时间相干流在潜在空间中对其进行扭曲来更好地合成空间细节和时间运动。

为了解开空间内容和时间动态的生成,LFDM 的训练由两个独

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉迷单车的追风少年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值