真实数据超分三大方法（BSRGAN、Real ESRGAN、SwinIR）训练细节整理

BigerBang

已于 2023-11-28 18:05:46 修改

阅读量2.4k

点赞数 26

分类专栏：超分辨率文章标签：深度学习计算机视觉超分辨率重建

于 2023-11-28 17:49:51 首次发布

本文链接：https://blog.csdn.net/BigerBang/article/details/134672740

版权

6 篇文章

订阅专栏

本文详细介绍了BSRGAN、RealESRGAN和SwinIR在真实数据超分中的训练方法，包括所需数据集、训练步骤和关键超参数设置，便于开发者参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 训练代码

	数据（只需要HR图像）	退化模型
BSRGAN	DF2K (DIV2K and Flickr2K) , WED and 2,000 face images from FFHQ	BSRGAN
Real ESRGAN	DF2K (DIV2K and Flickr2K) + OST	Real ESRGAN
SwinIR	DF2K (DIV2K and Flickr2K) + OST	BSRGAN

DIV2K(800 training images):http://data.vision.ee.ethz.ch/cvl/DIV2K/DIV2K_train_HR.zip
Flickr2K(2650 images): https://cv.snu.ac.kr/research/EDSR/Flickr2K.tar
OST(10324 images for sky,water,grass,mountain,building,plant,animal): https://openmmlab.oss-cn-hangzhou.aliyuncs.com/datasets/OST_dataset.zip
FFHQ（Flickr-Faces-HQ Dataset）：https://github.com/NVlabs/ffhq-dataset
WED(Waterloo Exploration Database: New Challengesfor Image Quality Assessment Models, 4,744 images)：https://ece.uwaterloo.ca/~k29ma/exploration/

	lr	iterations	lr is halved	loss
BSRGAN	1e-4	2000k	[200K, 400K, 600K, 800K, 1000K]	L1
Real ESRGAN	2e-4	1000K	无	L1
SwinIR	2e-4	1000K	[500K,800K,900K,950K]	L1

GAN training stage

	lr	iterations	lr is halved	loss
BSRGAN	G:5e-5; D: 5e-5	1600K	[800k]	1* L1+1* perceptual loss + 0.1*gan loss
Real ESRGAN	1e-4	400K	无	1* L1+1* perceptual loss + 0.1* gan loss
SwinIR	G: 1e-4; D:1e-4	600K	[400K,500K,550K,575K]	1* L1+1* perceptual loss + 0.1* gan loss