图像质量评估——论文精读系列

Madhusudana P C, Birkbeck N, Wang Y, et al. Image quality assessment using contrastive learning[J]. IEEE Transactions on Image Processing, 2022.

(本篇博客中出现的图片大部分来源于原论文)


[toc]

文章结构

  • ABSTRACT
  • I. INTRODUCTION
  • II. RELATED WORK
    • NR-IQA Models
    • Self-Supervised Learning

  • III. METHOD
    • A. Auxiliary Task

    • Multi-scale Learning and Cropping

    • Quality Preserving Transformations/Augmentations

    • Realistic Distortions

    • Patch Features

    • Evaluating Representations

  • IV. EXPERIMENTS AND RESULTS

    • Experimental Settings

    • Correlation Against Human Judgments

    • Cross Dataset Evaluation

    • Visual Comparison of Representations

    • Significance of Training Data

    • Robustness to Training Data

    • Importance of Different Color Spaces

    • Significance of Multi-scale Learning

    • Effect of Batch Size and Crop Size

    • Limitations of the Model

  • V. CONTRIQUE FULL-REFERENCE MODEL

  • VI. CONCLUSION


[]

Abstract

想用自监督来做质量评估任务

  1. CNN : 用成对的图像来对比学习,完成辅助任务——预测失真类型和失真等级
  2. 提出方法: CONTRastive Image QUality Evaluator (CONTRIQUE)

I. INTRODUCTION

  1. 介绍图像质量评估是做什么的;介绍NR IQA是做什么的,所面临的挑战(受多因素的影响、受图像内容的影响);NR IQA研究的必要性,应用场景。
  2. NR IQA 技术发展的历程:合成失真的数据集的生成及其缺点,真实失真数据集的生成及其特点。针对这些数据集,NR IQA模型所要针对解决的点。

  3. 建立NR-IQA模型主要依赖于参数化和学习方法。介绍了几种类型的NR-IQA 模型,包括 基于NSS的模型:通过统计获取特征用于质量预测;其优点是对于合成失真较为有效,但对于未知失真的图像质量预测效果表现受限; 基于CNN的模型:数据驱动的IQA 模型。

  4. 基于CNN的模型最大的限制:缺少带标签的大数据集,而建造数据集是一个很耗资源的活动。但是已经存在的数据集又太小,不能很好的训练CNN网络模型。因此大部分CNN网络针对以上问题的解决方案是:迁移学习(pretrained & fine-tuned), 缺点:针对不同的数据集,要做不同的超参数的微调。此外,过度微调容易产生过拟合,使得模型泛化性能下降。

  5. 我们打算使用没有标签的数据集来做 IQA,灵感来自于用于图像分类问题的无监督/自监督学习方法。

创新点:

  1. 失真类型、失真等级的预测作为辅助任务(CNN的训练在同时包含合成失真和真实失真的无标签的数据集上做,使用对比目标函数)

  2. 为了学习较强的表征信息,在训练中,多尺度的、质量保持的转换(quality preserving transformations )被应用在无标签的数据集上。

  3. 测试时,CNN网络的权重被冻结,从CNN输出的特征被映射到简单的全连接层做质量回归,得到质量分数。在多个数据集上取得较好的结果(没有额外的CNN网络的微调)。

  4. 我们设计的网络(CONTRIQUE )很简单,泛化性好,而且可以简单的扩展到FR IQA问题中(不用另外训练CNN网络)。

II. RELATED WORK

NR-IQA Models

        所面临的挑战(跟自己本篇paper沾边的,也就是说,本篇paper能解决的问题)。以往工作是如何处理解决这一问题的。例如本文:提出问题—图像内容对于不同失真类型所附加的额外影响,影响到 IQA。

        以往工作解决方案 :

  1. 提出超的网络结构来区分质量预测和内容理解
  2. 等级平滑损失函数
  3.  元学习:从不同的失真类型中获取先验知识
  4. 同时训练图像以及图像块

    以上工作大部分都依赖于监督学习,然后做微调来获得好的效果。我们的工作主要是基于无监督,并且不需要微调。

    提了一下transformer,并指出了本篇工作不适用transformer做基底的原因:模型较为复杂,需要大量的数据和算例,而且本篇工作主要在于讨论无监督学习,所以只基于CNN来做。

  • 将NR 模型扩展到分类任务上。

  • 模型大概的结构:特征提取 + 质量回归

        特征提取的方式多种多样:传统:基于NSS的模型,一句话概括方法,列举几个例子,优缺点(重点是缺点)。

  • 基于深度学习的模型:一句话概括方法;

        优缺点,针对缺点目前的工作所给出的解决策略;

        列举几个例子:

    • 失真鉴别+质量预测的双流网络

    • 分别针对真实失真和合成失真的网络

    • 训练中应用 FR-IQA maps作为监督指导信息

    • 应用主观质量评估分数的分布统计信息

Self-Supervised Learning

        自监督/无监督学习技术奏效,得益于从图像数据中提取到了有用的结构信息。

        列举了一些自监督任务的例子

        本篇提出将失真类型和失真程度的鉴别作为自监督任务,来帮助学习图像特征,以辅助质量预测任务。

III. METHOD

        带通转换,如小波样分解,经常用于模拟初级视觉皮层的视觉神经元的反应,这些神经元对具有特定空间位置、频率和方向的视觉刺激进行调谐。

        传统的NR-IQA模型是基于带通道转换,如DCT[12]、可导向金字塔[11]、局部均值-减法[13]、[14]等,在预测感知质量方面非常有效。

        深度cnn引出的转换在捕获感知图像伪影[18],[20],[21]方面表现出了显著的效率。

 

 Auxiliary Task

        概括什么是代理任务:代理的、密切相关的任务(真实标签较容易被知道或者获得)。然后我们的模型被训练来解决这个辅助任务,然后再将训练好的模型用在预测阶段。

        以IQA为例:

  • 目标——是获得能够区分不同类型失真以及失真程度的不同表征形式
  • 因此,我们就将 IQA特征学习任务 转换成了 分类任务
  • 每个类别是拥有相似失真类型以及相似失真程度的图像
  • 使用的目标函数:交叉熵损失函数

 

 

 损失函数

         N : 一个batch里的图像数量

Multi-scale Learning and Cropping

        利用多尺度的特征,基于CNN的IQA模型获取到了很好的结果。

        我们的CONTRIQUE 模型用到两个维度:

  • 原分辨率
  • 一半维度分辨率(通过沿两个维度的两个因子降采样获得,为了避免混叠伪影,在下采样前使用抗混叠滤波器。在这个调整大小操作中保留了纵横比,因为修改这个比例会影响底层图像的质量。)

        然后图像被随机裁剪到固定大小:M x M

Quality Preserving Transformations/Augmentations

        本篇选取的质量保持不变的变换:水平翻转 和 颜色空间转换

        我们使用了四种颜色空间方式:

  • RGB
  • LAB
  • HSV
  • Grayscale

Realistic Distortions

        在我们的模型中,每个UGC图像都被看作一个单独的类,由多种失真组合而成的一种结合,区别于其他UGC图像,也区别于合成失真的图像。

        对于给定的UGC图像:xi

        只有它的等变变换之后的图像: x j 跟它属于同一类 。

此时的损失函数是:

 

总的损失函数:

 

IV. EXPERIMENTS AND RESULTS

Correlation Against Human Judgments

 

 

Cross Dataset Evaluation

 

Visual Comparison of Representations

 

Significance of Training Data

 

Robustness to Training Data

 

Importance of Different Color Spaces

 

 

Significance of Multi-scale Learning

 

Effect of Batch Size and Crop Size

 

 

Limitations of the Model

 

目 录 第一章 引言 1 1.1 图像质量评价的定义 1 1.2 研究对象 1 1.3 方法分类 2 1.4 研究意义 3 第二章 历史发展和研究现状 4 2.1 基于手工特征提取的图像质量评价 4 2.1.1 基于可视误差的“自底向上”模型 4 2.1.1.1 Daly模型 4 2.1.1.2 Watson’s DCT模型 5 2.1.1.3 存在的问题 5 2.1.2 基于HVS的“自顶向下”模型 5 2.1.2.1 结构相似性方法 6 2.1.2.2 信息论方法 8 2.1.2.3 存在的问题 9 2.2 基于深度学习图像质量评价 10 2.2.1 CNN模型 10 2.2.2 多任务CNN模型 12 2.2.3 研究重点 15 第三章 图像质量评价数据集和性能指标 16 3.1 图像质量评价数据集简介 16 3.2 图像质量评价模型性能指标 17 第四章 总结与展望 19 4.1 归纳总结 19 4.2 未来展望 19 参考文献 21 第一章 引言 随着现代科技的发展,诸如智能手机,平板电脑和数码相机之类的消费电子产品快速普及,已经产生了大量的数字图像。作为一种更自然的交流方式,图像中的信息相较于文本更加丰富。信息化时代的到来使图像实现了无障碍传输,图像在现代社会工商业的应用越来越广泛和深入,是人们生活中最基本的信息传播手段,也是机器学习的重要信息源。 图像质量是图像系统的核心价值,此外,它也是图像系统技术水平的最高层次。但是,对图像的有损压缩、采集和传输等过程会很容易导致图像质量下降的问题。例如:在拍摄图像过程中,机械系统的抖动、光学系统的聚焦模糊以及电子系统的热噪声等都会造成图像不够清晰;在图像存储和传输过程中,由于庞大的数据量和有限通讯带宽的矛盾,图像需要进行有损压缩编码,这也会导致振铃效应、模糊效应和块效应等图像退化现象的出现。所以,可以说图像降质在图像系统的各个层面都会很频繁地出现,对图像质量作出相应的客观评价是十分重要且有意义的。为了满足用户在各种应用中对图像质量的要求,也便于开发者们维持、控制和强化图像质量图像质量评价(Image Quality Assessment,IQA)是一种对图像所受到的质量退化进行辨识和量化的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值