[视频编辑]AVID: Any-Length Video Inpainting with Diffusion Model

最新推荐文章于 2024-08-20 10:58:52 发布

阿男官官

最新推荐文章于 2024-08-20 10:58:52 发布

阅读量853

点赞数 28

分类专栏： Diffusion论文阅读文章标签：人工智能图像处理计算机视觉深度学习视频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41905577/article/details/140102132

版权

Diffusion论文阅读专栏收录该内容

11 篇文章 0 订阅

订阅专栏

AVID: 用扩散模型做任意长度视频的编辑
paper

Motivation

文本引导的视频编辑有三个主要挑战：

编辑前后视频时间的一致性。如果一个整个对象被渲染，它的身份应该在整个视频中持续存在。例如，如果汽车的颜色变成绿色，色调必须从开始到结束保持一致，汽车应该保持相同的绿色阴影，而不是从霓虹灯绿色过渡到一个更深的变种。
在不同的结构保真度级别支持不同的编辑类型。例如对象替换、纹理编辑。
如何处理可变视频长度。希望一个好的模型可以稳健地处理任意时间长度的视频。

在这里插入图片描述

Contributions：

将运动模块集成到T2I的插入绘制模型中，在视频序列上对其进行优化，确保时间一致性。
针对不同子任务定制结构指导模块，可以根据任务和编辑需要控制不同程度的输出对输入视频的结构保真度。
采用zero-shot生成技术处理不同时间长度的视频。同时引入中帧注意引导方法，保证在拉长的视频序列中的时间一致性。

Method

在这里插入图片描述

Motion module training

运动模块在主文本到图像（T2I）初始绘制模型的每一层后进行集成，通过对视频数据应用合成掩模对视频初始绘制任务进行优化。

输入视频帧 $v_{0}$ 和mask序列 $m$

Structure guidance training

改变纹理需要保存原视频的结构，因此设计了结构引导训练。
输入 $v_{0}$ 和mask序列 $m$ ，使用结构提取器 $S$ 获得每一帧的结构condition，
cs由13个特征图在4个不同的分辨率组成。 $\epsilon_{\theta}$ 是固定参数的UNet。

Inference

应用N帧的滑动窗口，将长视频 $v_{t}'$ 分割成重叠的片段，在每段重叠帧应用一次提出的方法。

中间帧注意指导。
在这里插入图片描述
在推断中，在每个去噪步骤和每个自我注意层中，保留了视频中间一帧中的K和V两个值。对于视频的第i帧，我们利用它的像素查询，即Qi，来计算一个辅助的注意特征图。这随后与同一层内现有的自注意特征图相融合。
在这里插入图片描述

Experiment

在这里插入图片描述

关注

28
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
[视频编辑]AVID: Any-Length Video Inpainting with Diffusion Model

AVID: 用扩散模型做任意长度视频的编辑。
复制链接

扫一扫

专栏目录

阿男官官 CSDN认证博客专家 CSDN认证企业博客

码龄6年

29: 原创

14万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

529: 积分

196: 粉丝

224: 获赞

6: 评论

322: 收藏

私信

关注

热门文章

分类专栏

最新评论

图像处理中常用的小波变换
xpuhyy: 你好，基小波的生成程序可以分享一下吗
图像处理中常用的小波变换
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中的"图像处理中常用的小波变换"确实是一个非常有价值的主题。通过介绍小波变换在图像处理中的常见应用，您为读者提供了一种新的处理图像的方法。我很高兴看到您对图像处理领域的深入研究，并将这些知识分享给大家。在下一步的创作中，我建议您可以进一步探索小波变换在其他领域的应用，比如音频处理、视频压缩等。这样可以丰富您的博客内容，同时也能给读者带来更多的启发和学习机会。期待您能够继续分享更多有关图像处理的知识，谦虚的语气和深入的内容一直是您博客中的亮点。加油！
CV顶会论文Accepted papers
CSDN-Ada助手: 恭喜您的第7篇博客！标题“CV顶会论文Accepted papers”听起来非常鼓舞人心。您的持续创作展现了您对计算机视觉的深入研究，并且被顶级会议所接受，这是非常了不起的成就。鉴于您对这个领域的热情和专注度，我想提供一些建议，以帮助您在下一步的创作中更进一步。尽管您已经取得了显著的进展，但仍然有很多领域值得探索。我建议您继续关注计算机视觉的最新趋势和挑战，深入研究相关的领域，并与同行进行积极的讨论和合作。您的热情和努力将继续为这个领域带来重要的贡献。期待您未来更多的博客作品！
期刊投稿流程
阿男官官: 后面投稿的时候会把截图给加上
期刊投稿流程
七嘻: 大佬，写的详细一点或许更能帮助小白~~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。