SEAL: 面向real-SR的全面评估框架(ICLR24)

SEAL: A FRAMEWORK FOR SYSTEMATIC EVALUATION OF REAL-WORLD SUPER-RESOLUTION (ICLR24)

SEAL是第一个全面的real-SR评估框架,促进了real-SR的发展;

code: https://github.com/XPixelGroup/SEAL

paper: https://arxiv.org/pdf/2309.03020

1、存在的问题

Fig1. Real-ESRGAN中的二阶退化模式
  • 真实世界超分辨率(real-SR)方法专注于处理多样化的真实世界图像。关键思想是使用复杂的高阶退化模型来模拟现实世界的退化。尽管在各种场景下取得了不错的成绩,但仍面临评估的障碍。

  • 目前,一些real-SR方法仅通过从大的退化空间空间中随机选择的一组退化的平均性能来评估模型的性能,无法提供对其整体性能的全面了解,会产生不一致且可能具有误导性的结果。

  • 当面对不同的随机退化时,不同模型表现出不同的性能表现,如上图 (a)。

2、解决方法

  • 提出了两个新的评测指标来更加全面的评测real-SR模型的性能表现,Acceptance Ratio (AR)和Relative Performance Ratio (RPR);

  • 提出了一个新的评估框架SEAL,主要包括了:聚类算法,验收/卓越线以及评估策略;

3、SEAL

Fig2. SEAL的整体算法流程
  • 首先,需要通过聚类算法将退化空间中的退化聚类为K类,然后用K个类中心来生成对应的测试集:

  • 分别设置了一个Acceptance Line和Excellence Line用来表示real-SR的模型性能;

  • Accepetance Line(AL)是在一个小型的网络上训练一个non-blind的模型作为基准,如FSRCNN;

  • Excellence Line (EL) 是在大的网络上训练一个non-blind模型作为基准,如SRResNet;

  • $Q^d$为real-SR模型在$D^{test}$上的性能表现,如PSNR/SSIM;$Q^{ac}$表示AL模型在$D^{test}$的性能表现,$Q^{ex}$表示EL模型在$D^{test}$的性能表现;

Fig3. 由粗到细的SEAL的评估流程

3.1 Acceptance Rate (AR)

  • AR表示real-SR模型可以超过AL的百分比,位于0-1之间;

  • AR表示了一个real-SR模型的基本性能;

3.2 Relative Performance Ratio (RPR)

RPR表示了real-SR模型相对于AL和EL的一个性能指标:

  • \sigma是sigmoid function,RPR_{i} > \sigma(0)=0.5表示了real-SR模型在第i个测试上好于AL;

  • RPR_{i} > \sigma(1)=0.73表示real-SR模型在第i个测试上好于EL;

  • RPR_I表示在大多数退化情况下表现出类似改进的情况,RPR_ARPR在AL之上的均值,RPR_URPR在AL之下的均值;

4、实验

4.1 数据和训练设置

  • 为了验证不同的real-SR真正的性能表现,使用BSRGAN和RealESRGAN模型以相同的概率生成1\times10^{4}种退化对于Set14中的lenna图片;

  • 使用谱聚类的方式,生成100个类中心,然后用类中心的退化设置生成100个测试集合,分别在Set14和DIV2K,表示为Set14-SE和DIV2K_val-SE;

  • 分为MSE-Loss和GAN-Loss的两种模型,GAN的AL和EL模型分别为RealESRGAN和RealHATGAN;

  • 对于AL和EL模型,使用预训练好的模型再进行微调;

4.2 对比实验

对于不同的方法使用SEAL进行评估;

Fig4. 评估指标对比
  • 对于得到的指标,RPR_A小于0.5的不参与排名,Table 2 中的Rank是以AR -> RPR_I为参考的;

  • 相对于其他的评判指标更加的稳定,如PSNR和LPIPS;

和Random随机采样来测试进行对比:

Fig5. 不同Random随机采样的对比测试
  • Table 3 中可以看出对于两个Random的采样数据,BSRNet的性能表现是不一样的,不能表示在整个退化空间上的表现;

  • 在Set14-SE上的测试结果是在整个退化空间上选出的最具代表性的100个test,更加的稳定和可靠;

  • Table 4在DIV2K_val-SE上的结果,也验证了模型性能的一致性,BSRNet的AR指标更高;

4.3 消融实验

谱聚类中心的个数

Fig6. 谱聚类中心个数的消融实验
  • 当类中心大于60时,性能表现趋于稳定,选择100作为类中心的个数;

聚类相似性矩阵的计算  

Fig6. 相似性矩阵计算方式的消融实验
  • 使用图像的直方图来对聚类的结果进行评估相比于MSE和SSIM要更准确;

退化聚类的稳定性

Fig7. 退化聚类时图像个数的消融实验
  • 横轴表示使用多少个图像来进行聚类,计算聚类中心的退化参数;

  • 不同的图像进行聚类,得到的结果是一致的,也验证了SEAL评估框架的稳定性;

4.4 实验效果

LPIPS指标下的可视化结果

Fig8. 实验可视化结果
  • 绿色为AL模型的性能,红色为EL模型的性能,各模型的表现在SEAL下的评估如Fig8;

不同cluster的图像退化程度的一个可视化

Fig9. 不同cluster聚类的退化的可视化结果

  • 不同cluster能够将相似的退化聚类到一起,表明对退化空间聚类的有效性,提取到大的退化空间中重要的退化组。

  • 13
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Crossformer是一种利用交叉维度依赖性进行多元时间序列预测的Transformer模型。这个模型的动机是填补之前Transformer在处理多元时间序列时对不同变量之间关系刻画不足的问题。之前的Transformer更多地关注如何通过时间维度的注意力机制建立时序上的关系,而忽略了变量之间的关系。Crossformer通过引入时间维度和变量维度两个阶段的注意力机制来解决这个问题。特别是在变量维度上,Crossformer提出了一种高效的路由注意力机制。这篇论文填补了多元时间序列预测中变量关系建模的空白,并在ICLR2023中被提出。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *3* [【ICLR 2023】 CrossFormer增强多元时间序列建模能力](https://blog.csdn.net/qq_33431368/article/details/129483613)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [读论文《Crossformer:利用跨维度依赖进行多变量时间序列预测的Transform》](https://blog.csdn.net/vzvzvzv/article/details/131376526)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值