【论文阅读】Depth-Aware Video Frame Interpolation

最新推荐文章于 2024-08-08 08:04:59 发布

秋名山小法师

最新推荐文章于 2024-08-08 08:04:59 发布

阅读量4.5k

点赞数 4

分类专栏：论文阅读文章标签：深度学习视频插值单目深度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/olivertai/article/details/102776724

版权

本文探讨了深度学习在视频插帧中的应用，重点关注如何处理大规模运动和遮挡问题。通过引入深度信息，作者改进了光流估计方法，以提高插帧效果。论文提出的方法包括使用深度辅助光流融合、上下文特征提取和自适应warping层，展示了在多个数据集上的优越性能。然而，作者也指出了深度图精度对结果的影响以及算法的局限性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目主页：https://sites.google.com/view/wenbobao/dain
项目Git：https://github.com/baowenbo/DAIN
论文地址：https://arxiv.org/pdf/1904.00830.pdf

简介

近年来基于深度学习的视频插帧成为了计算机视觉的研究方向之一，视频插值主要一般会用于一下几个方面：

慢动作视频生成（slow-motion）
视角合成（view synthesis）
视频码率提升（frame rate up-conversion）

首先作者分析了近年来的深度学习网络在应对视频插值任务时所遇到的主要问题和瓶颈，主要有两点:

无法处理大规模运动场景（large motions）
只有隐式的（implicitly）或干脆没有处理遮挡区域填充问题（occlusions）

作者针对这两点进行了优化，并达到了目前state-of-art的效果。这篇文章是作者团队基于其在2018年发表的论文MEMC-Net做的改进，下面来研究研究作者都做了哪些工作。

算法流程

先来看下整个算法的流程图：

可以看到用到了几个部分：光流、深度、上下文特征、插值kernel等等，下面来分别看下每个部分。

光流

作者在文章中提出了两种根据光流warp原图的方式：

根据光流 $F_{0\rightarrow1}$ 和时间 $t$ 计算出 $I_0$ 到 $I_t$ 的光流 $F_{0\rightarrow t}$ 并正向warp输入图 $I_0$ ，这种操作会造成遮挡区域的空洞问题，也就是前景移走了之后背景没有内容来填充，对于 $I_1$ 同理。
根据光流 $F_{0\rightarrow1}$

最低0.47元/天解锁文章

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。