Video Super-resolution with Temporal Group Attention 论文阅读笔记

最新推荐文章于 2021-06-18 09:32:50 发布

边学边写

最新推荐文章于 2021-06-18 09:32:50 发布

阅读量409

点赞数

分类专栏：机器学习文章标签： pytorch 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43108465/article/details/108394914

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Video Super-resolution with Temporal Group Attention 论文阅读笔记

论文做出的贡献。

论文做出的贡献。

提出了一种新颖的神经网络，该神经网络可以通过帧速率感知组以分层方式有效地融合时空信息
介绍了一种快速空间对齐方法来处理运动较大的视频
所提出的方法在两个流行的VSR基准上实现了最先进的性能。

相关工作

在这里插入图片描述
首先作者提出了将视频帧按照距离参考帧的大小来分组，如图中（1，2，3，4，5，6，7）的帧就被分为了三组（1，4，7），（2，4，6），（3，4，5）。
这么做的原因有两个：

距离参考帧不同距离的帧所提供的信息是互补的的，尤其在遮挡，大运动，扭曲的情况下。
参考帧可以作为提取信息的指引。

组内融合模块

组内融合模块的作用是为每个分组提供特征提取和信息融合，每个模块包含三个部分，其中使用的卷积层都会依据不同的分组带有不同的膨胀因子（dilation rate）其依据是距离远的帧所带有的运动偏向更大。另外值得一提的是，每个组内融合的权重是共享的。

组间融合模块

在这里插入图片描述
组间融合模块使用了注意力机制，并且通过softmax，以时间轴压缩不同帧。

组间融合模块的目标是在不同的时间群中聚合信息，并生成高分辨率的残差图。

上采样

最后生成的高分辨率残差图和bicubic 图进行融合上采样。

快速时空对齐方法FSA

不同以往使用的光流估计方法，作者估计每组连续帧之间的同质性，并且将相邻帧扭曲到参考帧。
在这里插入图片描述
与光流估计相比较计算同质性的方法更加的有效和高效率，由于计算每个像素的光流，不完善的光流估计会给翘曲带来意想不到的像素级失真，破坏原始图像的结构。然而计算同质性（homography）可以利用传递性的性质一次完成，减少了计算的冗余。
在这里插入图片描述

与其他方法的对比

在这里插入图片描述
表现十分优秀。

论文主体部分分析到这里，关于具体执行的细节和有关的灵敏度分析可以参考具体论文。
论文地址

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Video Super-resolution with Temporal Group Attention 论文阅读笔记

Video Super-resolution with Temporal Group Attention 论文阅读笔记论文做出的贡献。相关工作组内融合模块组间融合模块上采样快速时空对齐方法FSA与其他方法的对比论文做出的贡献。提出了一种新颖的神经网络，该神经网络可以通过帧速率感知组以分层方式有效地融合时空信息介绍了一种快速空间对齐方法来处理运动较大的视频所提出的方法在两个流行的VSR基准上实现了最先进的性能。相关工作首先作者提出了将视频帧按照距离参考帧的大小来分组，如图中（1，2，3，4，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。