【CVPR2020视频超分辨率】Zooming Slow-Mo: Fast and Accurate One-Stage Space-Time Video Super-Resolution 阅读笔记

最新推荐文章于 2022-11-26 17:21:02 发布

刘芋儿

最新推荐文章于 2022-11-26 17:21:02 发布

阅读量1.9k

点赞数 2

分类专栏：超分辨率文章标签：计算机视觉深度学习

本文链接：https://blog.csdn.net/weixin_43514766/article/details/109599625

版权

本文介绍了Zooming Slow-Mo方法，它在统一框架内处理视频帧插值和超分辨率，提高处理低帧率、低分辨率视频到高分辨率慢动作视频的效率。通过时域特征内插网络和可变形ConvLSTM，实现比两阶段方法更快、更准确的性能。实验证明，该方法在速度和模型尺寸上都有显著优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

paper：Zooming Slow-Mo: Fast and Accurate One-Stage Space-Time Video Super-Resolution

code：Zooming-Slow-Mo-CVPR-2020

简介

本文探讨了时空视频超分辨率任务，即从低帧速率、低分辨率的视频中生成高分辨率的慢动作视频。一个简单的解决方案是将其分成两个子任务：视频帧插值（VFI）和视频超分辨率（VSR）。然而，时间域的内插和空间域的超分是有内在相关性的。如果分成两阶段操作，则不能充分利用视频的自然属性。另外，目前的VFI或VSR网络需要大的帧合成模块及超分重建模块来预测高质量的视频帧，这使得两阶段方法具有较大的模型尺寸，从而导致计算量很大，非常耗时。为了克服这些问题，文章提出了一种单步时空视频超分辨率模型，它直接从LFR，LR（低帧率、低分辨率）视频合成高分辨率慢动作视频。该方法没有像VFI网络那样合成原本不存在的LR视频帧，而是首先通过所提出的时域特征内插网络（feature temporal interpolation network），来插入LR帧特征。然后，我们提出了一个可变形的ConvLSTM来同时对齐和聚合时间信息，以便更好地利用时域特征。最后，采用了重建网络预测HR慢动作视频帧。在基准数据集上的大量实验表明，所提出的方法不仅具有较好的定量和定性表现，而且比目前最新的两阶段方法（如DAIN+EDVR和DAIN+RBPN）快3倍以上。