Dreamix: Video Diffusion Models are General Video Editors

Dreamix提出了一种基于扩散模型的视频编辑方法,支持文本驱动的运动和外观编辑。通过结合新的混合微调模型和图像动画框架,能够在保持细节的同时对视频进行高级编辑。此方法首先对视频添加部分高斯噪声,然后通过微调模型恢复细节和运动信息。此外,它还能将静态图像转换为动画视频。
摘要由CSDN通过智能技术生成

Dreamix: Video Diffusion Models are General Video Editors

Abstract

扩散模型已经广泛的应用于图像编辑,但是却很少用于视频编辑,提出了一种基于扩散模型的方法,能够对普通视频进行基于文本的运动和外观编辑。同时介绍了一种新的图像动画框架,通过将图像转为视频,然后使用视频编辑器进行动画处理。
contribution:

  1. 提出一种基于真实世界视频的基于文本的外观和运动编辑方法。
  2. 提出一种新的混合微调模型,提高了运动编辑的质量
  3. 在简单的图像预处理操作之后应用视频编辑器的方法,提出一种新的文本引导图像的动画框架
    项目主页:https://dreamix-video-editing.github.io/

Method

利用下采样的视频并添加部分高斯噪声所谓输入,而不是完全的高斯噪声。
由于输入的视频分辨率高度损坏,不能有效的保留视频的分辨率细节,通过在输入视频上添加微调模型来解决这个问题。
在这里插入图片描述
将整个视频和帧的无序集合作为输入,第一个目标通过要求模型在给定其噪声版本的情况下准确的重构输入视频实现在运动和外观上更新模型先验。同时,训练模型在给定其噪声版本下单独的重建每个帧,这与目标的运动无关。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
基于这两个损失函数对模型进行微调,尽可能的保证模型的外观细节的保留。

application

在这里插入图片描述
输入一张图片,复制为16张,利用16个透视变换,只输入图片时,设置α=0,对图形进行微调,之后再使用dreamix转化为视频。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值