cvday04(BasicVSRCVPR文章问题）

最新推荐文章于 2024-04-26 09:36:31 发布

lmx001206

最新推荐文章于 2024-04-26 09:36:31 发布

阅读量170

点赞数

文章标签： pytorch 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lmx001206/article/details/121109293

版权

无语实现basicsv超分辨，数据包导入之后就会出错。还有终端打开一些命令也要有大小写的区分，anaconda，pytorch，cuda环境都弄好了。明天把cudnn弄下再实现算法

今天把git配置好了把mmediting项目导入到pycharm中了，继续加油ba!

VSR视频超分带来的额外挑战也就是一些技术问题相比较于单图像超分辨率，涉及到从视频序列中多个高度相关但没有对齐的帧中聚合信息。

VSR技术主要就是通过传播，对齐，聚合，上采样这四个环节来改进的。basicvsr技术就是利用传播和对齐组件的选择使得性能和效率的提高，双向传播方案来收集信息，基于光流的方法来估计相邻帧之间的特征进行对齐。

Related Work 现有的VSR方法主要分为滑动窗口和递归两种框架，现在发展vSR基本就是递归框架

Methodology:VSR技术的发展主要是空间维度和时间维度的聚合信息的过程的多重考虑，以往的研究只是在一个维度进行处理，但basic是两个维度宏观角度。

basic中的结构分析：1 propagation：现有的传播方案分三大类：本地传播、单向传播、双向传播。经过验证，前两种均有劣势，只有双向有用。2alignment（对齐）也是有三种方式：无对齐、图像对齐、特征对齐。最终这个实验验证的是特征对齐。利用无对齐则性能会不佳。就是通过排除法来选择出最优的是特征对齐。BasicVSR最大的优点就是有很高的通用性，因为他很容易纳入额外的组件来处理不同情况，也就是说除了上述四个组件以外还可以加其他的。

一些挑战就是：在信息边沿部分，对于对齐的问题还是存在一些问题

Experiments:

conclusion:这些工作可以扩展到其他的视觉任务，比如：视频去模糊，去燥、着色

要有高效、轻量级的 VSR 技术，将大量低分辨率 (LR) 视频升级为高分辨率 (HR) 视频

SR技术的研究对象是视频资源的图像序列。

而图像序列就是连续的帧，由一系列静态图像组成。

当视频中的物体运动速度较快，在单个图像中表现为运动模糊效果，因此目标帧与其相邻帧之间会出现子像素位移。因此，VSR系统使用有效的运动补偿算法对齐相邻帧至关重要。

采样路线的不同，大致可以分为两类：基于插值的上采样方法（interpolation-based upsampling methods）和基于学习的上采样方法（learning-based upsampling methods）。

由于所有基于插值的上采样方法都会导致图像边缘模糊，而基于学习的上采样方法则具有强大的特征学习能力

我的总结问题：分为四个部分就是改进这四个部分就能出现恢复效果和计算速度的变化，传播、对齐、聚合、上采样。主要是对齐和上采样存在一些问题：对齐：VSR系统使用有效的运动补偿算法对齐相邻帧至关重要。

具体对齐和上采样有什么改进的可以再查资料看看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cvday04(BasicVSRCVPR文章问题）

无语实现basicsv超分辨，数据包导入之后就会出错。还有终端打开一些命令也要有大小写的区分，anaconda，pytorch，cuda环境都弄好了。明天把cudnn弄下再实现算法
复制链接

扫一扫

lmx001206 CSDN认证博客专家 CSDN认证企业博客

码龄4年

39: 原创

42万+: 周排名

123万+: 总排名

3万+: 访问

: 等级

423: 积分

8: 粉丝

9: 获赞

11: 评论

50: 收藏

私信

关注

热门文章

最新评论

parse_args的使用:
用户628777: 所以怎么办呢，RuntimeError: stack expects a non-empty TensorList我也是遇到了这个问题。
提升cv的工程即代码能力
努力成为算法工程师: 有没有好一点的baseline 代码？推荐一下谢谢，我是做视频超分辨率的。其他视觉方向的代码也行，谢谢
深度学习数据加载过程：
Krovsiki: 老师可以描述一下arbsr那个训练集要怎么处理吗？就是DIY2k那个
Meta-sr 复现的环境配置问题：
飞羽、屋: 请问传参部分报错怎么修改
cvday16（做到这个程度就好）
lmx001206: 重新更正下，怎么讲。训练一个超分网络，他们用的训练数据集都是分辨率比较低的那种数据集就不会那么大。即640x256下采样到160x64这样再一起输入，对比获取lr-hr的特征关系。所以其实同样的这里分辨率就是提高了4倍，即我们输入1k变4k但是这时候要看你的cuda能不能承受得住，即cpu内存够不够你一次性输入很多图片，像我做的这个640-2k就是每次输入50张照片来还原，但是合成的视频总是抖动很大。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。