CVPR2022，RealBasicVSR，MMEditing复现，使用自己的数据集进行迁移训练

最新推荐文章于 2022-11-27 11:17:19 发布

阿航626

最新推荐文章于 2022-11-27 11:17:19 发布

阅读量1.8k

点赞数 2

分类专栏：超分论文复现计算机视觉文章标签：超分辨率重建图像处理音视频计算机视觉深度学习

本文链接：https://blog.csdn.net/weixin_53610475/article/details/126440161

版权

17 篇文章 1 订阅

订阅专栏

7 篇文章 2 订阅

订阅专栏

3 篇文章 1 订阅

订阅专栏

活动地址：CSDN21天学习挑战赛

最简单的办法是拿高清图像进行低清图像的制作（可以插值放大后再降采样）
或者通过商业的超分软件进行高清视频的制作（可以使用topaz video enhance，运行需要显卡，超分速度与显卡有关）（商业超分软件普遍应用范围广泛，但场景针对性不够强，清晰度也不够高，可以用来进行迁移学习）
最后要得到的是一对一对的高清和低清的图像对
视频也要拆解成图像，如果直接使用视频的话，对设备要求极其高

图像名称：必须是00000000.png~99999999.png之间，格式必须是png，这和MMEditing的源码有关
指定文件夹：假设低清图片和高清图片都在文件夹data/mine_data下，一般将低清图片存在data/mine_data/lq文件夹下，高清图片存在data/mine_data/gt文件夹下，这两个文件夹会在mine_train.py中指定
结构：在指定的文件夹之后的路径、结构、图片名，低清图片和高清图片要保持完全一致，程序会根据低清图片的路径和指定的高清图片的存储文件夹去推断对应的高清图片路径，如果不一致，会找不见对应的高清图片

有两个很耗费显存的参数：num_input_frams和cfg.evaluation.interval，二者都很容易导致显存不够用
num_input_frams：前后关联的图像数量。因为BealBasicVSR是针对视频的，所以会考虑关联帧之间的相互作用，而这个参数就是用来设定关联帧的数目。
- 原模型参数是15
- 但使用GTX 3070显卡，8G显存，即使将batch size降低到了4，这个参数降低到8都会超出显存
- 3070显卡比较理想的设置是num_input_frams=6，batch size设为20，8G显存占用了7.9G，batch size提升到30就会超出显存
cfg.evaluation.interval：每过多少轮进行验证
- 这个参数设为10都会报错超出显存（源代码中是500，如果没训练到对应设定的轮次不会报错），
- 一直没找到办法可以避免，除非限制训练时候占用的gpu资源，降低num_input_frams，但这会严重影响训练效果
- 选择取消验证，将它注释掉，并且train_model(model, datasets, cfg, distributed=False, validate=False,meta = meta)，用validate=False来取消验证