投稿文章
文章平均质量分 92
已投稿公众号的文章,请勿转载
WangsyUQ
每隔几日会发布论文的阅读心得和代码复现,欢迎关注~
展开
-
通过Patch-Base来优化VSR中的时间冗余
作者单位:西交、字节智能创造实验室、南理工编者言:现有的VSR算法都没有讨论来自静止目标和背景的时间冗余的影响。时间冗余会给信息传播带来不利影响,这限制了现有的VSR的性能。本文通过优化的方式处理时间冗余补丁来改进现有的VSR算法,开发了两种简单有效的即插即用方法,改善了现有的滑窗和循环的VSR算法。VSR的相邻帧包含静止物体、背景等相似内容(时间冗余)。如果这些时间冗余内容主导了传播过程,由于没有从时间域引入额外的有用信息,将不利于重建。原创 2022-09-07 21:52:29 · 521 阅读 · 1 评论 -
CVPR2022 | 无需对齐就能胜任大运动超分的内存增强非局部注意方法
作者单位:京东探索研究院笔者言: 如何对齐是VSR中具有挑战的任务,光流方法和可变性卷积在中等运动的视频中具有显著优势,然而在处理大运动视频时会失效。本文通过非局部注意方式跳过对齐来融合相邻帧,在大运动视频上实现了SOTA。本文提出了一种内存增强非本地注意网络(MANA)。以前的方法主要利用相邻帧来辅助当前帧的超分。这些方法在空间帧对齐方面存在挑战,并且缺乏来自相邻帧的有用信息。相比之下,本文设计了一种跨帧非局部注意机制,允许视频在没有帧对齐的情况下实现超分,从而对视频中的大运动更加健壮。原创 2022-09-07 21:51:43 · 1039 阅读 · 3 评论 -
CVPR2022 | 利用Lipschitz约束来稳定循环VSR的推理
作者单位:赛峰电子与防务、巴黎萨克雷大学等现有循环VSR对于慢动作的长时间序列的处理并不理想,比如视频监控的应用中。由于不精确隐藏状态叠加,随着时间推移超分辨率结果会产生伪影。针对这个问题,本文从Lipschitz稳定性的角度分析并对VSR进行约束来稳定推理过程。循环VSR模型在推理小动作范围的长视频序列时(其中一些场景几乎没有移动),循环处理产生偏差导致高频伪影。本文首先构造了一个长时间序列数据集 — Quasi-Static,然后在这个数据集上揭示了这种不稳定性。原创 2022-09-07 21:51:12 · 426 阅读 · 0 评论 -
重新思考 VSR Transformers 中的对齐
作者单位:清华深研院、上海人工智能实验室、悉尼大学等XPixel的又一力作,作者在各个方面分析了应用在Transformer中使用各种现有对齐方法,进一步说明了保存亚像素信息的重要性,并提出图像补丁对齐方法,在REDS4上达到了32.72db。对齐向来是 VSR 中的重要操作,然而自注意机制的进展可能会违背这一常识。本文重新思考了 Transformer VSR 中对齐的作用,并进行了一些反直觉的观察。原创 2022-08-20 20:09:19 · 534 阅读 · 0 评论 -
AnimeSR:可学习的降质算子与新的真实世界动漫VSR数据集
本文出自xintao大佬团队,AnimeSR的主要贡献如下:从真实的LQ动画中学习降质算子以更好地捕捉真实退化的分布;构建了一个大规模的HQ动画视频数据集AVC以便于动画VSR的训练和评估;有效的“输入缩放策略”使学习这些神经操作成为可能;进一步研究了一种高效的多尺度网络结构使AnimeSR实现SOTA。输入缩放策略略显主观,更加客观的筛选方案时候是否是后续可以继续研究的内容呢,其次,过往单项VSR的输入为LRt−1LR_{t-1}LRt−1和LRtLR_tLRt。...原创 2022-08-05 11:18:39 · 447 阅读 · 0 评论 -
如何让VSR又稳又快——高效视频超分中的残差稀疏连接学习
作者单位:清华深研院、字节、苏黎世联邦理工将剪枝技术应用到VSR中以实现更加有效和高效的VSR,在时延、参数量、FLOPs、PSNR的综合评估上实现了较好的性能,剪枝后的BasicVSR相比EDVRM实现了0.46dB的增益并只需其三分之一的推理时间。在资源受限的设备上运行VSR需要更轻和更快的方法。...原创 2022-08-05 11:18:02 · 917 阅读 · 1 评论 -
Recurrent+Transformer | 视频恢复领域的‘德艺双馨’
(本文首发于"我爱计算机视觉",如需转载等事宜请联系我爱计算机视觉)作者单位:苏黎世联邦理工、Meta、维尔茨堡大学论文链接:https://arxiv.org/pdf/2206.02146.pdf代码链接:https://github.com/JingyunLiang/RVRT笔者言: Jingyun大佬继SwinIR,VRT之后的又一篇力作,在Transformer结构中套用了循环架构(笔者最近也在research这个点,奈何大佬太猛了)并从帧级对齐扩展到片段对齐。RVRT在VID4上超过了VR原创 2022-06-12 14:36:04 · 965 阅读 · 0 评论 -
最快可达 SwinIR 4倍的高效超分网络 | ELAN
(本文首发于"我爱计算机视觉",如需转载等事宜请联系我爱计算机视觉)作者单位: 香港理工大学、OPPO论文链接:https://arxiv.org/abs/2203.06697代码链接:https://github.com/xindongzhang/ELANTransformer通过利用自注意(self-attention, SA)进行特征提取,取得了令人印象深刻的结果。然而SA的计算是非常昂贵的,并且一些操作对于SR任务来说可能是冗余的。本文提出了一种高效的远程注意网络(ELAN),它首先采用shi原创 2022-06-08 12:01:46 · 908 阅读 · 0 评论 -
ICML2022 | 将无监督流对齐与Seq2Seq引入到视频恢复中
(如需转载等事宜请联系"我爱计算机视觉")作者单位:清华大学深研院、华为诺亚方舟Lab、ETHz论文链接:https://arxiv.org/pdf/2205.10195代码链接:https://github.com/linjing7/VR-Baseline笔者言: 本文将Seq2Seq的架构引入到了视频超分中,其次针对光流不准的问题,之前的文章选择使用DCN进行替代,本文从另一个角度出发,通过知识蒸馏的方法来训练更准的光流,想法很好但是相比于DCN的效果还有待进一步的优化。如何正确建模视频序列中的原创 2022-05-29 16:54:35 · 242 阅读 · 0 评论 -
来看看怎样让你的VSR模型跑的和苏炳添一样快
(如需转载等事宜请联系"我爱计算机视觉")作者单位:腾讯PCG ARC实验室论文链接:https://arxiv.org/pdf/2205.05069代码链接:https://github.com/TencentARC/Efficient-VSR-Training笔者言: VSR的训练雀食很费时间,本文提出多重网格训练和大型minibatch的办法来加速训练。客观的讲,空间周期变化对PSNR的影响相较时间周期要敏感一些,大型minibatch的方法固然可以加快速度但是使用中还需考虑显存问题。整体看来原创 2022-05-20 22:04:53 · 434 阅读 · 0 评论 -
CVPR2022 | 基于显式时间差分建模的视频超分辨率
(如需转载等事宜请联系"我爱计算机视觉")作者单位:快手、大连理工、港理工、北大等论文链接:https://arxiv.org/pdf/2204.07114.pdf笔者言: 之前的循环VSR方法大多将相邻帧参考帧以及前一时刻的SR输出作为输入,本文将未来的SR输出也参与进参考帧的重建,通过伪相邻SR的方式精进细节,这让笔者眼前一亮。大多数VSR都采用光流或可变形卷积进行运动补偿。然而,这种时间建模技术增加了模型的复杂性,并且在遮挡或复杂运动的情况下可能会失败。本文旨在探索显式时间差分建模在LR和HR空原创 2022-04-22 15:11:32 · 447 阅读 · 0 评论 -
视频超分中的自监督适应方案
作者单位:汉阳大学论文链接:https://arxiv.org/pdf/2103.10081.pdf编者言:本文采样半监督的方式训练VSR网络,并为知识蒸馏与基于自监督的SR任务的结合开辟了一个有趣的研究方向。自监督的SISR方法显示了不错的效果,但是扩展到视频超分方面还有待研究。摄像机或物体的前后运动在多帧中产生不同尺度的重复patch,较大的patch可能比相邻帧中相应的较小的patch包含更详细的信息,这些额外的细节有助于增强重建质量。为此,本文提出了一种基于patch复发性的自监督方法,允许VS原创 2021-12-03 14:22:01 · 200 阅读 · 0 评论 -
对于霸榜视频超分领域的VRT方法的深度解读
(如需转载等事宜请联系"我爱计算机视觉")作者单位:苏黎世联邦理工大学、Meta、鲁汶大学论文链接:https://arxiv.org/pdf/2201.12288.pdf代码链接:https://github.com/JingyunLiang/VRT编者言:本文为将Swin Transformer应用于单图超分中的SwinIR的视频扩展版本,在视频复原的各领域中都有很大的提升,本文将从视频超分方向来解读VRT。VSR通常需要利用多个相邻但通常不对齐的视频帧的时间信息。现有的方法通常利用滑动窗口策略原创 2022-03-28 15:47:29 · 1258 阅读 · 0 评论 -
26FPS在线输出720P视频的视频超分模型:DAP
作者单位:苏黎世联邦理工、鲁汶大学、维尔兹堡大学论文链接:https://arxiv.org/pdf/2202.01731v1.pdf编者言:不同于现阶段VSR的两大热点研究方向:真实世界/盲VSR、VSR与传输,本文作者在实时在线领域超分方向实现突破,这与IPRRN一文的出发点类似。本文DAP的效果堪比EDVR,但是时间缩短了三倍,180P视频在线可达26FPS!VSR的应用具有严格的因果、实时等限制。这存在两个挑战:未来帧的信息不可用、设计高效且有效的帧对齐和融合模块。本文提出了一种基于可变形注意金原创 2022-02-21 18:51:03 · 730 阅读 · 0 评论 -
ICCV2021|盲图超分中空间变异核估计的互仿射网络
现有的盲图超分算法假设模糊核在整幅图像上具有空间不变性。然而,由于物体运动和失焦等因素,模糊核通常具有空间变异。为了解决这一问题,本文提出了一种用于空间变异核估计的互仿射网络MANet。首先,它有一个适度的感受野以保持退化的局部性。其次,它使用互仿射卷积层,在不增加感受野、模型大小和计算负担的情况下增强特征的表达能力。MANet在合成图像和真实图像上的空间变异和不变核估计方面表现良好,并且在与非盲SR方法相结合时,也能获得最先进的盲SR性能。...原创 2021-12-03 14:21:31 · 406 阅读 · 0 评论 -
不用HR参与训练之盲视频超分中的自监督学习
(如需转载等事宜请联系"我爱计算机视觉")作者单位:南理工论文链接:https://arxiv.org/pdf/2201.07422.pdf代码链接:https://github.com/csbhr/Self-Blind-VSR编者言:以往的VSR采用监督的方式,生成SR图像与HR进行监督。本文采取自监督的方法(监督LR)来对网络进行训练约束,为盲视频SR算法应用自监督学习的开端之作,代码已开源。现有的VSR方法通常依赖于监督学习方法,其中训练数据通常由已知或预定义核(例如双三次核)的模糊操作生成。原创 2022-02-10 18:19:09 · 447 阅读 · 0 评论 -
哈工大&鹏程lab&武大将对比学习联合超分模型,实现了新的SOTA
作者单位:哈工大、鹏程实验室、武汉大学论文链接:https://arxiv.org/pdf/2111.13924.pdf编者言: 对比学习在high-level任务上取得了显著的成功,但获得的全局视觉表征不适应丰富纹理和上下文信息的low-level任务,本文对对比学习框架的改进并联合超分辨率模型实现了新的SOTA。本文中提出了一种对比学习框架,从样本构建和特征嵌入两个角度研究了基于对比学习的SISR。现有的方法使用一些简单的样本构建方法(比如将低质量输入视为负样本,GT视为正样本),并采用先验模型(比原创 2021-12-22 13:44:49 · 540 阅读 · 0 评论 -
刷新REDS4记录 | 多级视频超分:PP-MSVSR
作者单位:百度论文链接:https://arxiv.org/pdf/2112.02828.pdf代码链接:https://github.com/PaddlePaddle/PaddleGAN编者言:本文将局部窗口方法与循环方法相结合,在REDS4数据集上超越了BasicVSR++实现了SOTA,代码已开源!VSR任务的关键是充分利用帧间的互补信息来进行重构。由于来自不同帧的图像具有不同的运动和场景,因此准确对齐多帧并有效融合不同帧一直是VSR任务的关键研究工作。为了利用相邻帧丰富的互补信息,本文提出一个原创 2021-12-22 13:44:14 · 520 阅读 · 0 评论 -
刷新SOTA | 视频恢复的重中之重:时间对齐
作者单位:港中文、思谋论文链接:https://arxiv.org/pdf/2111.15288代码链接:https://github.com/redrock303/Revisiting-Temporal-Alignment-for-Video-Restoration.git编者言:本文主要侧重对视频帧中时间对齐的研究,提出了一种迭代对齐的方式来精细视频帧之间的对齐,从而成功的刷新了众多视频low-level领域的成绩!代码也已开源!看点对于视频恢复任务来说长距离时间对齐是重要的且具有挑战性的。.原创 2021-12-10 16:41:47 · 511 阅读 · 0 评论 -
真实世界VSR中的权衡研究:RealBasicVSR
作者单位:南洋理工大学论文链接:https://arxiv.org/pdf/2111.12704.pdf代码链接:https://github.com/ckkelvinchan/RealBasicVSR编者言: BasicVSR与BasicVSR++作者围绕BasicVSR的又一力作,把BasicVSR应用到了真实世界数据集中,实现了前所未有的视觉重建效果。真实世界VSR中的退化多样性和复杂性是不可忽视的挑战,本文围绕真实世界VSR完成如下三块的论述:VSR网络通过聚合来自多个帧的信息来增强细节并提高原创 2021-12-03 14:21:03 · 1002 阅读 · 0 评论 -
华威、剑桥与三星联合提出基于时间核一致性的盲视频超分辨率
看点本文通过实验发现,由于局部损失驱动偏移预测和缺乏显式运动约束,可变形对齐方法仍然存在快速运动问题。为此,本文提出了一个基于匹配的流估计模块(MFE)以进行全局语义特征匹配,并以粗偏移量的方式为每个位置估计光流。方法实验......原创 2021-10-20 13:38:33 · 223 阅读 · 0 评论 -
CVPR2021 | 视频超分辨率中时空蒸馏方案
作者单位:中科大论文链接:https://openaccess.thecvf.com/content/CVPR2021/papers/Xiao_Space-Time_Distillation_for_Video_Super-Resolution_CVPR_2021_paper.pdf编者言:将知识蒸馏结合时空特征应用到VSR任务上,加强了学生网络的时空建模能力,验证了知识蒸馏方案在VSR任务上的可行性。紧凑的VSR网络可以很容易地部署在智能手机等设备上,但与复杂VSR网络存在较大的性能差距。为此,本文提原创 2021-10-20 13:37:50 · 656 阅读 · 0 评论 -
AAAI2021 | 大运动VSR中的对偶子网与多阶通信上采样方案
作者单位:西电、鹏城实验室论文链接:https://arxiv.org/pdf/2103.11744.pdf编者言: VSR任务中第一个设计对偶学习的方案,多阶上采样的方法和添加对偶子网与对偶损失可以参考与学习本文的主要亮点如下:DSMC包含一个VSR子网(MSCU)和一个对偶子网,如下图所示:模型首先对输入的2m+1帧进行可变形卷积,进行粗特征提取。然后输出的特征图通过可变形残差网络(DResNet)处理,在考虑时间特征之前提取精细的空间信息。然后,将特征图输入到三维卷积u形密集残差网络 (U3D原创 2021-10-08 10:33:32 · 218 阅读 · 0 评论 -
针对视频压缩的压缩感知超分算法:COMISR
作者单位:谷歌论文链接:https://arxiv.org/pdf/2105.01237.pdf编者言: 针对H.264等视频压缩标准压缩后的视频进行超分,定量和定性效果相比过去的VSR算法有较大提升,有一定的业界价值。VSR专注于从LR视频中恢复HR视频,在对高度压缩的输入视频进行超分时往往会产生严重的伪影。本文提出了一种压缩感知超分辨率模型(COMISR),该模型可以在具有不同压缩级别的真实视频中表现良好。该模型由三个视频超分辨率模块组成:双向翘曲循环、细节保留的流估计和拉普拉斯增强。所有这三个模块原创 2021-10-04 13:11:46 · 1194 阅读 · 2 评论 -
ICCV2021 | 视频缩放任务中的自条件概率学习
作者单位:上交、北理、百度论文链接:https://arxiv.org/pdf/2107.11639.pdf编者言: 本文将视频缩放任务与视频压缩任务和视频动作识别任务联系起来,将模型中不可微分的模块通过辅助DNN训练求梯度的方法来进行模型的训练,相比H.265实现了较好的压缩率和恢复效果。本文提出了一个视频缩放的自条件概率框架(SelfC),以同时学习成对缩放过程。在训练时,在LR视频中有强时空先验信息的条件下,通过最大化降采样丢失信息的概率来减少丢失的信息熵。该方法利用LR视频中丰富的时间信息,通过原创 2021-09-29 13:01:40 · 191 阅读 · 0 评论 -
ICCV2021 | RealVSR:VSR任务中的新数据集与损失方案
作者单位:香港理工大学、阿里巴巴达摩院论文链接:https://www4.comp.polyu.edu.hk/~cslzhang/paper/ICCV21_RealVSR.pdf代码链接:https://github.com/IanYeung/RealVSR编者言: 这篇是19年ICCV的Toward real-world SISR一文的VSR版本。相比之前VSR方法中较为单一的损失,该文作者对于Y通道和CbCr通道的理解和附加的损失处理让人眼前一亮。人工退化模型并不能很好地描述真实视频中复杂的退化过原创 2021-09-29 13:01:03 · 880 阅读 · 0 评论 -
CVPR2021 | MIMO-VRN:用于视频缩放任务的联合训练策略
论文链接:https://arxiv.org/abs/2103.14858代码链接:https://github.com/ding3820/MIMO-VRN编者言: 本文以视频缩放任务为切入点,将IRN视频超分话化。与normal的VSR不同点在于将降采样也加入学习任务,这或许是后VSR时代一个不错的研究方向。最近的大多数研究都集中在基于图像的上下采样联合优化方案上,这些方案不考虑时间信息,为此,本文提出了基于耦合层可逆神经网络的两种联合优化方案。长短期记忆视频缩放网络(LSTM-VRN)利用低分辨率视原创 2021-09-16 13:47:45 · 259 阅读 · 0 评论 -
ICCV2021—工业界中的神经网络视频传输超分算法
作者单位:北京邮电大学、Intel中国研究院论文链接:https://arxiv.org/abs/2108.08202代码链接:https://github.com/Neural-video-delivery/CaFM-Pytorch-ICCV2021译者言:本文没有以网络结构的创新为切入点,而是利用超分辩率算法去优化神经网络视频传输任务,开辟了一个可以和工业界对接的新的研究方向。本文首先研究了在神经视频传输中不同块的模型之间的关系,然后设计了一个拥有内容感知特征调制层(CaFM)的联合训练框架来压缩原创 2021-09-14 12:40:19 · 529 阅读 · 0 评论 -
Transoformer再下一城之VSR-Transformer
论文连接:https://arxiv.org/pdf/2106.06847.pdf代码链接:https://github.com/caojiezhang/VSR-Transformer译者言:ETHz出品,第一篇在VSR中使用的Transformer模型,方法与思想值得学习。模型与实验没有文章中大批量的数学公式那样惊艳,有数学推理癖好的读者建议直接阅读原文。Transformer应用在VSR中有两大问题:为了解决第一个问题,本文提出了一个时空卷积自注意层以利用局部信息。对于第二个问题,本文设计了一个双向原创 2021-06-29 09:19:08 · 561 阅读 · 1 评论 -
神仙打架丨NTIRE2021视频超分挑战双赛道方案分享
论文链接:https://arxiv.org/pdf/2104.14852.pdf比赛链接:https://competitions.codalab.org/competitions/28051译者言:NTIRE2021已于近日落下帷幕。BasicVSR++在VSR赛道摘得桂冠,同时它在Vid4的测试集中也突破了29dB的大关;OVSR模型在比赛中也有亮眼的表现,其他许多局部+全局的方案也取得了较高的PSNR值,可谓是神仙打架。相比之下,STSR赛道并没有特别突出的方法。下文将会回顾这场比赛中两个赛道对原创 2021-05-14 21:08:59 · 648 阅读 · 3 评论 -
2021NTIRE的三冠一亚视频超分方案:BasicVSR++
论文链接:https://arxiv.org/pdf/2104.13371.pdf代码链接:https://github.com/open-mmlab/mmediting译者言:该文作者Kelvin C.K. Chan同为BasicVSR(2021CVPR)和Understanding Deformable Alignment…(AAAI2021)的第一作者,他用对于可变形对齐和传播架构的新理解来改进BasicVSR,在2021NTIRE挑战中一举获得三冠一亚,同时还在Vid4数据集上突破了29dB的.转载 2021-05-09 13:36:46 · 1257 阅读 · 0 评论 -
720P实时超分和强悍的恢复效果:全知视频超分OVSR
论文连接:https://arxiv.org/pdf/2103.15683.pdf作者单位:武汉大学、哈尔滨工业大学、武汉工业大学译者言:本文可以看做是PFNL(同一作者)的续作。LOVSR是将PFNL和混合架构的结合,GOVSR是PFNL和双向混合架构的结合。虽然模型在Vid4上最高可以达到28.41dB,但是训练数据集与大众不同,虽然作者最后也在Vimeo-90K中进行了实验,但是并没有给出在Vid4等测试集上的测试结果,具体数据还得等代码开源后进行额外测试。滑动窗口方法(a)只能通过增加窗口大小来原创 2021-05-07 18:55:06 · 752 阅读 · 0 评论 -
TIP2021 | 视频超分辨率中的多级特征融合网络
论文链接:https://ieeexplore.ieee.org/document/9351768/现有的VSR方法的主要问题是参考帧的特征与相邻帧的特征的融合是一步的,融合后的特征可能与原始LR中的视觉信息有较大的偏差。本文提出了一种端到端的多阶段特征融合网络,主要贡献为:下图显示了框架fMSFFNf_{MSFFN}fMSFFN,包括两个子网:时间对齐网络fTANf_{TAN}fTAN和调制特征融合网络fMFFNf_{MFFN}fMFFN。fTANf_{TAN}fTAN接受ItLRI^{LR}_原创 2021-03-26 21:30:09 · 1387 阅读 · 0 评论 -
一个不限制插值个数和上采样倍数的视频增强方法
作者单位:麦克马斯特大学论文:https://arxiv.org/pdf/2102.13011.pdf近年来,大量的视频增强研究致力于同时提高时间帧速率和空间分辨率,这些方法要么不能揭示时空信息之间的内在联系,要么在最终的时空分辨率的选择上缺乏灵活性。本文主要贡献如下:USTVSRNet能够在单个模型上按任意因子进行上采样。实验结果表明,该方法优于两阶段的SOTA方法,且计算量显著降低。USTVSRNet的总体结构如下图所示,它主要由4个子网络组成:帧内插网络(FINet)、特征提取网络、增强网络(En原创 2021-03-21 09:48:13 · 413 阅读 · 0 评论 -
DynaVSR:使用元学习的动态自适应盲视频超分辨率方法
论文:DynaVSR: Dynamic Adaptive Blind Video Super-Resolution代码:https://github.com/esw0116/DynaVSR大多的监督超分算法都是通过使用固定的已知核函数对高分辨率数据进行降尺度得到低分辨率数据的,但这种方法在实际场景中并不成立。最近有人提出了一些盲超分算法去估计每个输入LR图像的不同降尺度核。然而它们的计算开销很大,不适合直接应用于视频。本文的贡献如下:在深入研究本文的主要框架之前,简要地总结一下模型无关元学习(MAML)算原创 2021-01-12 11:30:10 · 1029 阅读 · 1 评论 -
综述丨视频超分辨率研究方法
近年来,深度学习在很多领域取得了进展,其中包括视频超分辨率任务。本文是第一个也是唯一一个视频超分方向的综述,主要看点如下:1)回顾了基于深度学习的视频超分技术的研究进展;2)提出了一种基于深度学习的视频超分分类方法,利用不同处理帧间信息的方式进行分类;3)总结了SOTA方法在一些公共基准数据集上的性能;4)分析了视频超分任务的一些前景和挑战;视频超分源于图像超分,其目的是从一个或多个低分辨率(LR)图像中恢复高分辨率(HR)图像。它们的区别也很明显,由于视频是由多个帧组成的,即前者通常利用帧间的信息原创 2021-01-07 09:42:33 · 6416 阅读 · 1 评论 -
即插即用,视频超分中的涨点神器:iSeeBetter
CNN在大尺度上的超分往往缺乏精细的细节纹理,生成性对抗网络能够缓解这个问题。为此,本文提出了一种基于GAN的时空视频超分方法——iSeeBetter,亮点如下:结合了SR中的SOTA技术: 使用循环反投影网络(RBPN)的作为其生成器,从当前帧和相邻帧中提取时空信息。使用SRGAN中的鉴别器,提高了超分辨率图像的“自然性”,减轻了传统算法中的伪影。优化了损失函数的架构: 本文使用了四重损失函数(MSE、感知损失、对抗损失和全变差损失(TV))来捕捉均方误差(MSE)可能无法捕捉到的图像中的精细细节,加原创 2021-01-03 09:29:23 · 854 阅读 · 0 评论 -
阿里巴巴优酷视频增强和超分辨率挑战的冠军方案:VESR-Net
作者单位:中国科学技术大学、微软亚洲研究院挑战赛链接:https://tianchi.aliyun.com/competition/entrance/231711/rankingList/1论文链接:https://arxiv.org/pdf/2003.02115.pdf译者:Wangsy视频增强与超分辨率(VESR)旨在从噪声和低分辨率视频帧中恢复高分辨率的细节。为了推动研究从受现实世界退化影响的低质量视频中恢复高质量视频,优酷举办了视频增强和超分辨率挑战赛,以探索在线视频应用程序中真实退化的数据集原创 2020-12-24 14:40:23 · 976 阅读 · 0 评论 -
视频超分:Understanding Deformable Alignment in Video Super-Resolution
论文:理解视频超分辨率中的可变形对齐可变形卷积最近在对齐多个帧方面表现出了令人信服的性能,并且越来越多地被用于视频超分辨率。尽管它有着显著的表现,但其潜在的对齐机制仍不清楚。本文仔细研究了变形对齐和经典的基于流的对齐之间的关系。贡献如下:1.第一次正式研究与确立变形对齐与基于流的对齐这两个重要概念之间的关系。2.系统地研究了偏移多样性。结果表明,偏移多样性是提高对齐精度和SR性能的关键因素。3.提出了一个偏移精度损失在保持偏移多样性的同时稳定训练,得到了1.7dB的改进。首先简要回顾可变形卷积(DC原创 2020-12-23 13:53:04 · 1267 阅读 · 1 评论 -
简洁的架构还能高效和准确?清华&华为提出新型残差循环超分模型:RRN!
论文:Revisiting Temporal Modeling for Video Super-resolution代码:https://github.com/junpan19/RRN本文提出了一种简洁而又高效的超分架构,在测试集上一帧只需45ms PSNR就可以达到27.69,具有很大的实用价值,亮点如下:2D CNN:采用了几个改进的2D残差块,每个块由3×3卷积层和ReLU组成。模型以2T+1个连续帧为输入,首先先在通道维度串联,然后通过一批残差块,输出shape大小为H×W×Cr2的残差特征图,通原创 2020-12-11 20:53:30 · 616 阅读 · 0 评论