文献阅读 - NIMA: Neural Image Assessment

NIMA: Neural Image Assessment


H. Talebi, P. Milanfar, NIMA: Neural Image Assessment, TIP (2018)


摘要

使用卷积神经网纲预测人类评分的分布(predict the distribution of human opinion scores using a convolutional neural network)

图像评分可靠、与人类的认知高度相关,并能辅助图像质量优化、增强(not only score images reliably and with high correlation to human perception, but also to assist with adaptation and optimization of photo editing/enhancement algorithms in a photographic pipeline)

无需参考图像(without need of a “golden” reference image)

1 引言

技术质量评价(technical quality assessment):衡量图像低层次衰退(measuring low-level degradations),如噪声、模糊、压缩伪影等

审美评价(aesthetic assessment):量化(quantify)图像中与情感和审美(emotions and beauty)相关的语义层面特征(semantic level characteristics)。

图像质量评价(image quality assessment)分为全参考(full-reference)和无参考(no-reference):有参考图像时,评价指标可采用PSNR、SSIM;无参考方法利用失真统计模型预测图像质量(blind (no-reference) approaches rely on a statistical model of distortions)。

A 相关工作

B 本文贡献

相比图像高、低评分分类(classifying images to low/high score)和平均分回归(regressing to the mean score),本文预测评分的直方图分布(the distribution of ratings are predicted as a histogram),预测结果与人类评分高度相关。

C AVA数据集(A Large-Scale Database for Aesthetic Visual Analysis)

在这里插入图片描述
在这里插入图片描述

D TID2013数据集(Tampere Image Database 2013)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2 方法

本文提出的质量、美学预测器以图像分类器为基础网络(the quality and aesthetic predictor stands on image classifier architectures),如VGG16、Inception-v2、MobileNet。

将CNN基础网络(baseline)的输出层替换为10个神经元(10 neurons)的全连接层(a fully-connected layer)并采用softmax激活。

在这里插入图片描述

训练阶段:将输入图像缩放至 256 × 256 256 \times 256 256×256(rescaled to 256 × 256 256 \times 256 256×256)、随机裁剪 224 × 224 224 \times 224 224×224区域并随机水平翻转(horizontal flipping)。

本文目标是预测给定图像的评分分布(the distribution of ratings) p ^ \hat{\mathbf{p}} p^。人类对给定图像评分的真实分布(ground truth distribution)可表示为经验概率质量函数(an empirical probability mass function)

p = [ p s 1 , ⋯   , p s N ] , ∑ i = 1 N p s i = 1 ,   s 1 ≤ s i ≤ s N \mathbf{p} = \left[ p_{s_1}, \cdots, p_{s_N} \right], \sum_{i = 1}^{N} p_{s_i} = 1, \ s_1 \leq s_i \leq s_N p=[ps1,,psN],i=1Npsi=1, s1si

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目 录 第一章 引言 1 1.1 图像质量评价的定义 1 1.2 研究对象 1 1.3 方法分类 2 1.4 研究意义 3 第二章 历史发展和研究现状 4 2.1 基于手工特征提取的图像质量评价 4 2.1.1 基于可视误差的“自底向上”模型 4 2.1.1.1 Daly模型 4 2.1.1.2 Watson’s DCT模型 5 2.1.1.3 存在的问题 5 2.1.2 基于HVS的“自顶向下”模型 5 2.1.2.1 结构相似性方法 6 2.1.2.2 信息论方法 8 2.1.2.3 存在的问题 9 2.2 基于深度学习的图像质量评价 10 2.2.1 CNN模型 10 2.2.2 多任务CNN模型 12 2.2.3 研究重点 15 第三章 图像质量评价数据集和性能指标 16 3.1 图像质量评价数据集简介 16 3.2 图像质量评价模型性能指标 17 第四章 总结与展望 19 4.1 归纳总结 19 4.2 未来展望 19 参考文献 21 第一章 引言 随着现代科技的发展,诸如智能手机,平板电脑和数码相机之类的消费电子产品快速普及,已经产生了大量的数字图像。作为一种更自然的交流方式,图像中的信息相较于文本更加丰富。信息化时代的到来使图像实现了无障碍传输,图像在现代社会工商业的应用越来越广泛和深入,是人们生活中最基本的信息传播手段,也是机器学习的重要信息源。 图像质量是图像系统的核心价值,此外,它也是图像系统技术水平的最高层次。但是,对图像的有损压缩、采集和传输等过程会很容易导致图像质量下降的问题。例如:在拍摄图像过程中,机械系统的抖动、光学系统的聚焦模糊以及电子系统的热噪声等都会造成图像不够清晰;在图像存储和传输过程中,由于庞大的数据量和有限通讯带宽的矛盾,图像需要进行有损压缩编码,这也会导致振铃效应、模糊效应和块效应等图像退化现象的出现。所以,可以说图像降质在图像系统的各个层面都会很频繁地出现,对图像质量作出相应的客观评价是十分重要且有意义的。为了满足用户在各种应用中对图像质量的要求,也便于开发者们维持、控制和强化图像质量,图像质量评价(Image Quality Assessment,IQA)是一种对图像所受到的质量退化进行辨识和量化的
### 回答1: iqa-nima是一种针对图像质量评估的深度学习算法,利用神经网络自动学习图像质量的特征,可以准确地评估图像的质量。该算法是基于NIMA(Neural Image Assessment)算法的改进版本,增加了对ISO等其他图像质量因素的考虑。 iqa-nima算法主要包括两个部分:训练阶段和测试阶段。在训练阶段,算法利用已有的高质量图像和对应的主观评价分数训练神经网络,学习图像质量的特征。在测试阶段,通过输入待评估的图像,经过神经网络计算得到图像的质量分数,从而进行图像质量评估。 iqa-nima算法采用了效率较高的ResNet架构作为神经网络,在训练阶段引入了数据增强和随机扰动等策略,提高了算法的鲁棒性。在测试阶段,算法还提供了集成多个神经网络的选项,可以进一步提高评估结果的准确性。 总的来说,iqa-nima是一种高效准确的图像质量评估算法,可以广泛应用在图像处理和计算机视觉等领域。 ### 回答2: iqa-nima是一种用于评估图像质量的算法。它基于神经网络,并利用了自然图像的统计规律来预测图像的质量。iqa-nima的全称是“Natural Image Quality Evaluator using Multi-scale Spatial and Spectral Features with Gradient Boosting Machine”。与其他传统的图像质量评估算法相比,iqa-nima具有较高的精度和鲁棒性。在实际应用中,iqa-nima可以用于图像压缩、图像增强、图像复原等场景中,用于判断图像质量改变的程度。iqa-nima的实现过程主要包括图像预处理(将输入图像转换为多尺度和多频段的特征图)、特征提取(利用CNN从特征图中提取空间和频谱特征)、训练模型(采用GBM,构建回归模型进行参数学习和预测)和评估图像质量(将图像输入模型进行预测)。iqa-nima的代码较为复杂,需要深入掌握图像处理、机器学习等相关领域的知识。 ### 回答3: iqa-nima 是一种基于神经网络的图像质量评价算法。该算法使用了深度神经网络模型来学习图像质量的特征,然后预测图像的质量分数。iqa-nima 算法的主要特点是高精度和高效率。与传统的基于数学模型的评价方法相比,它能够更加准确地评估图像质量。 iqa-nima 算法的核心思想是将图像转化为特征向量,然后再将特征向量输入到神经网络模型中进行学习和预测。该模型采用了一种叫做残差模块的结构,使得模型具有更好的拟合能力和泛化能力,从而提高了模型的预测结果的准确性。 此外,iqa-nima 算法还使用了一种特殊的损失函数,称为对比损失函数。该损失函数能够引导模型学习到图像质量的一些高级特征,从而提高了模型的鲁棒性和可靠性。在训练阶段,模型需要学习尽可能地准确地预测每张图像的质量,而在测试阶段,模型可以对新的图像进行评价和预测,从而提供更加准确的结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值