读“基于机器学习的无参考图像质量评估综述”有感

读“基于机器学习的无参考图像质量评估综述”有感

摘要: 无参数图像质量评价(NRIQA)因其广泛的应用需求一直以来都是计算机视觉及其交叉领域的研究热点。回顾近十几年来基于机器学习的典型NRIQA模型,介绍图像质量评价的常用数据库、算法性能指标、NRIQA主要难点和现有的解决方法;分析了不同模型的思想、实现、特点;最后统计对比多个数据库上的测试结果。
1.前言
视觉质量是图像复杂且固有的特征,其复杂度在和人脑视觉处理机制相关,因此对图像质量准确建模一直是热点研究问题。通常方法是与理想的成像模型或者完美的参考图像对比得到失真度量。根据是否存在可参考的图像,将图像质量评价方法分为全参考(FullReference,FR)、半参考(Reduced Reference,RR)和无参考(No Reference,NR)质量评价三类,其中无参考图像质量评价(NRIQA)也叫盲图像质量评价(Blind ImageQuality Assessment,BIQA).
NRIQA 方法在实际应用中,需求广泛但实现难度大于有参考图像或特征的方法。随机器学习发展尤其是深度学习对各个领域的影响一致,NRIQA技术也在不断革新。本文主要分析近十几年最为典型的NRIQA算法。

2.无参考图像质量评价方法衡量
图像质量评价旨在拟合人眼,通常以算法的评价价值与人眼的主观评分值进行计算比较。在公共数据库上,图像的主观评分值用平均主观得分(Mean OpinionScore,MOS)表示或者使用平均主观得分差异(Differential Mean Opinion Score,DMOS)表示。其范围因不同数据库而异,常见有[0,1]、[0,5]、[0,9]和[0,100]。MOS值越大表示图像质量越好,DMOS值越大表示图像质量越差。近年来提出的NRIQA方法大都基于机器学习方法,每种算法都有自己的提出思想和特点。为了方便与其他方法对比,通常选择在公共数据库上训练并测试,使用公认的技术指标进行算法性能衡量.
3.常用数据库和算法性能指标
今天我们就仅介绍常见的几个公开数据库和常用性能指标。
(1)LIVE(Laboratory for Image & Video Engineering)数据库是最为广泛应用的共享数据库,共 982幅图像,包含 JPEG2000、JPEG、白噪声、高斯模糊和快速瑞利衰减5种其他基准库共有失真类型,图像质量用范围为[0,100]的DMOS值表示。
(2)CSIQ(Categorical Subjective Image Quality)数据库[9]共 866 幅失真图像,6 种失真,图像质量由范围为[0,1]的DMOS值表示。
(3)TID2008(Tampere Image Database)数据库包
括 1 700失真幅图像,17种失真,范围[0,9]的 MOS值表示质量。
(4)TID2013数据库将TID2008扩充至3 000幅图像,包含 24 类失真,同时给出峰值信噪比、结构相似度SSIM值[2,6]、MSSIM值、像素域的VIF值等作参考。
除此之外,NRIQA算法性能衡量指标最广泛采用的是视频质量专家组(VQEG)采用的评估标准——线性相关系数和秩相关系数。此外,还有评估方式以解决没有MOS值的大规模图像数据库。
(1)线性相关系数(Linear Correlation Coefficient LCC),也称皮尔逊线性相关系数(Pearson Linear Correlation Coefficient,PLCC),描述预测值与主观评分之间的相关性和算法的准确性.
(2)秩相关系数(Spearman’s Rank-Order Correlation Coefficient,SROCC)衡量算法的单调性.

除此之外为解决图像标注数据量不足,基于深度学习的 BIQA 算法分为两类:一类直接利用标注的 MOS/DMOS 标签训练浅层网络,这类方法称为OA-BIQA(Opinion Aware);另一类从结合其他非IQA数据库设计自动标签生成模型、任务分段实现等方式增加训练数据规模,称为 OF- BIQA(OpinionFree)方式或OU-BIQA(OpinionUnaware).
4.机器学习中的典型模型

  1. 通用 BIQA 算法学习从图像特征到相应质量分数映射,或者在映射之前将图像分成不同的失真。这类型的算法均面临以下问题:(1)需要大量样本训练鲁棒性;(2)实验证明算法对不同数据集敏感;(3)使用新训练样本时必须再训练。而NSS 特征反映了图像内容的自相似性和特定性,因此不存在对不同数据库敏感,使用新样本时也无需再训练.

  2. 在深度学习中质量预测是在输出层做回归,将图像多维特征转化为一个可以表示质量的数值。通常依赖失真图像和相应意见分数来学习将图像特征映射到质量分数的回归函数。这类型的模型被认为是具有“观察意识”(Opinion Aware,OA)的BIQA模型.

  3. 训练可靠的OA-BIQA模型需要大量的人工评分训练样本,但通过主观测试获得意见分数通常昂贵且耗时,训练数据极其有限。同时OA-BIQA模型通常具有弱泛化能力,在实践中的可用性受限。相比之下 OF-BIQA不需要主观评分来进行训练,具有更好的综合能力的潜力。因此有必要开发不依赖主观意见分数来进行训练“自主意识”(Opinion Free,OF)的 BIQA 模型。第一个OF-BIQA 模型是 2012 年由 Mittal 等提出的 TMIQ 模型.

5.结束语
经过此次的学习,我认为我们要积极利用各个领域的新方法新技术去大胆学习,虽然在这片文章中我看到了许多技术和方法,但是各个方法之间还是有有一些可以相互借鉴,相互补充的.
[参考文献]:
1.杨璐, 王辉, 魏敏. 基于机器学习的无参考图像质量评价综述[J]. 计算机工程与应用, 2018, 54(19):40-48.

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
目 录 第一章 引言 1 1.1 图像质量评价的定义 1 1.2 研究对象 1 1.3 方法分类 2 1.4 研究意义 3 第二章 历史发展和研究现状 4 2.1 基于手工特征提取的图像质量评价 4 2.1.1 基于可视误差的“自底向上”模型 4 2.1.1.1 Daly模型 4 2.1.1.2 Watson’s DCT模型 5 2.1.1.3 存在的问题 5 2.1.2 基于HVS的“自顶向下”模型 5 2.1.2.1 结构相似性方法 6 2.1.2.2 信息论方法 8 2.1.2.3 存在的问题 9 2.2 基于深度学习图像质量评价 10 2.2.1 CNN模型 10 2.2.2 多任务CNN模型 12 2.2.3 研究重点 15 第三章 图像质量评价数据集和性能指标 16 3.1 图像质量评价数据集简介 16 3.2 图像质量评价模型性能指标 17 第四章 总结与展望 19 4.1 归纳总结 19 4.2 未来展望 19 参考文献 21 第一章 引言 随着现代科技的发展,诸如智能手机,平板电脑和数码相机之类的消费电子产品快速普及,已经产生了大量的数字图像。作为一种更自然的交流方式,图像中的信息相较于文本更加丰富。信息化时代的到来使图像实现了无障碍传输,图像在现代社会工商业的应用越来越广泛和深入,是人们生活中最基本的信息传播手段,也是机器学习的重要信息源。 图像质量图像系统的核心价值,此外,它也是图像系统技术水平的最高层次。但是,对图像的有损压缩、采集和传输等过程会很容易导致图像质量下降的问题。例如:在拍摄图像过程中,机械系统的抖动、光学系统的聚焦模糊以及电子系统的热噪声等都会造成图像不够清晰;在图像存储和传输过程中,由于庞大的数据量和有限通讯带宽的矛盾,图像需要进行有损压缩编码,这也会导致振铃效应、模糊效应和块效应等图像退化现象的出现。所以,可以说图像降质在图像系统的各个层面都会很频繁地出现,对图像质量作出相应的客观评价是十分重要且有意义的。为了满足用户在各种应用中对图像质量的要求,也便于开发者们维持、控制和强化图像质量图像质量评价(Image Quality Assessment,IQA)是一种对图像所受到的质量退化进行辨识和量化的

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小小福仔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值