CVPR2022,RealBasicVSR,MMEditing复现,使用自己的数据集进行迁移训练


活动地址:CSDN21天学习挑战赛

1.前置步骤

  • 环境配置可以参考这里
  • 视频超分相关知识参看这里
  • 使用REDS公开数据集跑通训练模型参考这里

2.自己数据集的制作

  • 最简单的办法是拿高清图像进行低清图像的制作(可以插值放大后再降采样)
  • 或者通过商业的超分软件进行高清视频的制作(可以使用topaz video enhance,运行需要显卡,超分速度与显卡有关)(商业超分软件普遍应用范围广泛,但场景针对性不够强,清晰度也不够高,可以用来进行迁移学习)
  • 最后要得到的是一对一对的高清和低清的图像对
  • 视频也要拆解成图像,如果直接使用视频的话,对设备要求极其高

3.指定的结构

  • 图像名称:必须是00000000.png~99999999.png之间,格式必须是png,这和MMEditing的源码有关
  • 指定文件夹:假设低清图片和高清图片都在文件夹data/mine_data下,一般将低清图片存在data/mine_data/lq文件夹下,高清图片存在data/mine_data/gt文件夹下,这两个文件夹会在mine_train.py中指定
  • 结构:在指定的文件夹之后的路径、结构、图片名,低清图片和高清图片要保持完全一致,程序会根据低清图片的路径和指定的高清图片的存储文件夹去推断对应的高清图片路径,如果不一致,会找不见对应的高清图片

4.参数调整

  • 有两个很耗费显存的参数:num_input_frams和cfg.evaluation.interval,二者都很容易导致显存不够用
  • num_input_frams:前后关联的图像数量。因为BealBasicVSR是针对视频的,所以会考虑关联帧之间的相互作用,而这个参数就是用来设定关联帧的数目。
    • 原模型参数是15
    • 但使用GTX 3070显卡,8G显存,即使将batch size降低到了4,这个参数降低到8都会超出显存
    • 3070显卡比较理想的设置是num_input_frams=6,batch size设为20,8G显存占用了7.9G,batch size提升到30就会超出显存
  • cfg.evaluation.interval:每过多少轮进行验证
    • 这个参数设为10都会报错超出显存(源代码中是500,如果没训练到对应设定的轮次不会报错),
    • 一直没找到办法可以避免,除非限制训练时候占用的gpu资源,降低num_input_frams,但这会严重影响训练效果
    • 选择取消验证,将它注释掉,并且train_model(model, datasets, cfg, distributed=False, validate=False,meta = meta),用validate=False来取消验证

5.开始训练

  • 设定好参数,准备好数据集后,就可以开始训练了:python mine_train.py
  • 祝好,希望来到更清晰的世界
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
CVPR 2022是计算机视觉和模式识别领域的顶级会议,而多模态研究是其重要的研究方向之一。多模态处理涉及处理和融合来自不同感知模态(例如图像、语音、文本等)的信息,以提高对现实场景的理解能力。 在CVPR 2022多模态方向的研究中,一些关键的趋势和话题将得到关注。首先,基于深度学习的多模态方法将继续发展,因为其在处理多模态数据中的高级特征表示方面取得了显著成果。这些方法使用强大的神经网络架构,能够跨不同感知模态获取数据并实现融合。此外,对于多模态研究的探索还将进一步推动更加复杂和深层次的网络设计,以实现更好的融合效果。 其次,跨模态学习也是CVPR 2022多模态研究的重要方向之一。这项研究旨在利用不同模态之间的共享知识,通过迁移学习和领域自适应等技术,从一个模态中的标记数据中学习到其他未标记模态的有效表达。这对于那些有限标记数据的模态研究任务非常有价值。 最后,CVPR 2022多模态方向还将关注各种真实应用场景中的挑战和问题。例如,多模态医学图像处理和分析领域的研究,可以辅助医生进行更准确的诊断和疾病检测。另外,多模态文本和图像生成方面的研究,也能够推动现实世界中的创造性设计和内容生成。 总之,CVPR 2022多模态方向的研究将继续推动计算机视觉和模式识别领域的发展。通过深度学习、跨模态学习以及应用于不同领域的研究,我们可以期待在多模态数据处理和融合方面取得更多突破和创新。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿航626

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值