Image Quality Assessment using Contrastive Learning

备注:2021年,有代码 

1、摘要:

目前存在的方法都有哪些问题:缺乏大量有label的数据集,尤其是对于真实失真图像没有参考图像,label也很匮乏。

我们的方法:以一种自监督的方式获得图像质量表示,最大的特点就是不需要lable。使用失真类型和失真程度作为辅助任务来从未标记的数据集中学习特征。这个数据集中既有合成失真,也有真实失真。因为从NRIQA的角度来看,我们希望获得一个对合成和真实失真都有效的模型,所以我们训练一个CNN模型来解决辅助任务。方法简称CONTRIOUE。同时在评估期间,CNN权重被冻结并且线性回归映射学习到的特征到质量分数。

2、主要方法

我们的目标是学习辅助任务,输入一张失真图像,我们希望模型可以区分图像所属的失真类型和失真程度,同时对它进行正确的归类。所以我们将图像质量评价从一个回归问题转化为分类问题。然后在推理阶段,根据原任务(图像质量评价)对在辅助任务中训练得到的模型进行评估,获得最终的质量分数。

网络框架:

(1)辅助任务 

 推导过程:假设对于合成失真图像一共有D种类型的失真,每种失真类型下有L种失真程度。所以一共有(包含原始图像)。 

主要由一个编码器f(.)和投影头g(.)组成。(但是论文中给出的网络结构图似乎并没有标出“投影头”部分)输入一张图像x(∈R 3*H*W)

 h是编码器的一个D维输出,z是投影头的输出。请注意,整个模型z的输出是一个K维向量(其中K是本设计中的超参数)。其目标是获得属于同一类的图像的相似表示z。衡量两张图像之间的相似度:

合成图像的损失函数:

 P(i)是包含与xi(但不包括索引i)和jP(i)j属于同一类的图像索引的集合,|P(i)|是它的基数

对于真实失真例如UGC图像,由于失真类型和程度的复杂性,我们假设每一张真实失真图像单独属于一个类别,除了它的缩放和转换版本。

 损失函数:

总损失:

 N是一个batch中的图像数量,l是判断输入图像是合成还是真实失真的一个函数。在训练过程中,为了避免偏置,每一个batch,Iteration中合成与真实失真图像取等量。

(2)之前的文章有使用多尺度特征来获得显著的视觉质量。

所以我们使用两种尺度,一个是全尺度和一个经过下采样的半尺度,在半尺度之前使用抗混叠滤波器避免混叠。 过程中保留图像的长宽比,改变比例会影响图像质量。

对图像进行随机裁剪为M*M,若小于M*M,则进行补零操作。假设裁剪不影响图像的失真类型,裁剪后的图像依旧继承了原图像的失真类型。

 (3)质量保持转换增强

不改变图像质量的操作称之为图像质量变换。使用水平翻转、颜色空间转换和带通变换。使用不同的颜色空间动机是为了提取跨不同领域呈现的互补质量信息,使用了4种:RGB,LAB,HSV,灰度。网络框架中,对输入图像进行裁剪后随机选择颜色空间。不使用积极的增强技术,比如颜色抖动,高数模糊,随机调整大小,MixUp,AutoAugment等等,因为它这些方法会修改失真信息,不能保持图像质量。

(4)图像裁剪是P*P大小不重叠的图像块。假设不论是合成还是真实失真裁剪的图像块都继承了原图像的失真类型,不需要继承它的感知质量。

(5)使用辅助任务学习到的模型进行原任务的质量评估。

在辅助任务训练完成后,丢弃掉“投影头”网络g(.),使用编码器网络h=f(.)的输出作为图像表示。使用在冻结的编码器网络上训练的正则化线性回归器(ridge regression)。回归权重是在包含GroundTruth真值的合适的IQA数据集上训练的。ridge regression可以表示为: 

W是一个与h具有相同维数的可训练向量,λ是正则化参数,M是h的维数,N是训练集中出现的图像数。与训练类似,我们遵循多尺度约定,并在两种分辨率下计算特征:全尺度和半尺度,最终表示是两种尺度的串联。在计算期间,所有表示都是按照输入图像的原始分辨率计算的,不执行额外的数据增强。

疑问:为什么要对图像使用质量不变的操作?为什么结构图中没有“投影头”部分?对合成失真图像和真实失真图像之间求损失,是因为我们希望模型既能学习到合成图像的特征,也能学习到失真图像之间的特征,所以两者之间的差别应该越小越好吗?

还是有很多细节没有看懂,对文章的结构也不清晰明了。科研之路道阻且长呀.........

 参考文章:图解SimCLR框架,用对比学习得到一个好的视觉预训练模型_ronghuaiyang的博客-CSDN博客

[论文阅读](Image Quality Assessment using Contrastive Learning)_我的昵称怎么改不了啊的博客-CSDN博客

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
目 录 第一章 引言 1 1.1 图像质量评价的定义 1 1.2 研究对象 1 1.3 方法分类 2 1.4 研究意义 3 第二章 历史发展和研究现状 4 2.1 基于手工特征提取的图像质量评价 4 2.1.1 基于可视误差的“自底向上”模型 4 2.1.1.1 Daly模型 4 2.1.1.2 Watson’s DCT模型 5 2.1.1.3 存在的问题 5 2.1.2 基于HVS的“自顶向下”模型 5 2.1.2.1 结构相似性方法 6 2.1.2.2 信息论方法 8 2.1.2.3 存在的问题 9 2.2 基于深度学习的图像质量评价 10 2.2.1 CNN模型 10 2.2.2 多任务CNN模型 12 2.2.3 研究重点 15 第三章 图像质量评价数据集和性能指标 16 3.1 图像质量评价数据集简介 16 3.2 图像质量评价模型性能指标 17 第四章 总结与展望 19 4.1 归纳总结 19 4.2 未来展望 19 参考文献 21 第一章 引言 随着现代科技的发展,诸如智能手机,平板电脑和数码相机之类的消费电子产品快速普及,已经产生了大量的数字图像。作为一种更自然的交流方式,图像中的信息相较于文本更加丰富。信息化时代的到来使图像实现了无障碍传输,图像在现代社会工商业的应用越来越广泛和深入,是人们生活中最基本的信息传播手段,也是机器学习的重要信息源。 图像质量是图像系统的核心价值,此外,它也是图像系统技术水平的最高层次。但是,对图像的有损压缩、采集和传输等过程会很容易导致图像质量下降的问题。例如:在拍摄图像过程中,机械系统的抖动、光学系统的聚焦模糊以及电子系统的热噪声等都会造成图像不够清晰;在图像存储和传输过程中,由于庞大的数据量和有限通讯带宽的矛盾,图像需要进行有损压缩编码,这也会导致振铃效应、模糊效应和块效应等图像退化现象的出现。所以,可以说图像降质在图像系统的各个层面都会很频繁地出现,对图像质量作出相应的客观评价是十分重要且有意义的。为了满足用户在各种应用中对图像质量的要求,也便于开发者们维持、控制和强化图像质量,图像质量评价(Image Quality Assessment,IQA)是一种对图像所受到的质量退化进行辨识和量化的
### 回答1: SAR(合成孔径雷达)影像质量评估是一项用于评估合成孔径雷达图像质量的过程。SAR是一种采用雷达原理进行成像的技术,它可以对地球表面进行高分辨率的观测,具有良好的穿透障碍物的能力,并且不受天气条件的限制。因此,SAR影像质量评估对于正确地解释和分析雷达数据非常重要。 SAR影像质量评估可以通过以下几个方面来进行: 1. 分辨率:分辨率是指雷达影像中可以识别的最小物体大小。高分辨率意味着可以看到更小的细节,因此更好地了解地表特征。 2. 噪声:噪声是影响图像质量的一个重要因素,它可能会掩盖地表特征并降低图像的可用性。通过对图像进行噪声滤波等处理,可以减少噪声的影响。 3. 斑点:斑点是指图像中的不规则亮度变化,它可能来自于雷达系统的不稳定性。通过对图像进行斑点滤波等处理,可以减少斑点对图像质量的影响。 4. 平滑度:平滑度是指图像中的亮度变化程度。平滑度不宜过高,否则可能会造成细节的丢失。因此,合理的平滑度可以提高图像的质量。 5. 几何校正:SAR影像在获取过程中可能会发生几何失真,这将影响图像的准确性和质量。通过对图像进行几何校正,可以提高图像的质量和准确性。 总之,SAR影像质量评估是确保合成孔径雷达图像质量和准确性的重要步骤。合理评估和处理SAR影像质量,将有助于提高对地表特征的解释能力,并促进对雷达数据的正确分析和利用。 ### 回答2: SAR(Synthetic Aperture Radar)影像质量评估是对合成孔径雷达所生成的影像进行评估的过程。SAR影像质量评估的目的是确保影像的准确性和可用性。 在SAR影像质量评估中,常用的评估指标包括图像分辨率、噪声、辐射校准、几何校正等。首先,图像分辨率是评估SAR影像质量的重要指标之一,它衡量了影像中目标的清晰度和细节程度。图像分辨率较高意味着能够更准确地识别和分析目标。 其次,噪声是影响SAR影像质量的另一个重要因素。SAR影像在获取过程中会受到多种干扰源的影响,如大气湿度、电磁干扰等,这些干扰会导致影像中出现噪点。评估SAR影像噪声水平的准确性,有助于提高图像质量。 此外,辐射校准和几何校正也是SAR影像质量评估的关键步骤。辐射校准用于确保影像中灰度值的准确性和一致性,而几何校正用于纠正影像中的几何畸变,使影像更符合实际地物的形状。 为了进行SAR影像质量评估,可以采用目视评估和客观评估两种方法。目视评估依靠人眼对影像进行主观判断,而客观评估则是基于一系列算法和指标进行自动化评估。两种方法结合使用,可以更全面地评估SAR影像的质量。 综上所述,SAR影像质量评估是一项关键的工作,它可以确保SAR影像的准确性和可用性。通过评估图像分辨率、噪声、辐射校准和几何校正等指标,可以得到一个准确地评估SAR影像质量的结果。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值