文献阅读 - NIMA: Neural Image Assessment

NIMA是一种无参考图像质量评估方法,通过卷积神经网络预测人类对图像的评分分布,与人类感知高度相关,适用于照片编辑和增强算法的优化。文章介绍了NIMA的损失函数、实验结果和其在图像评级、增强中的应用。
摘要由CSDN通过智能技术生成

NIMA: Neural Image Assessment


H. Talebi, P. Milanfar, NIMA: Neural Image Assessment, TIP (2018)


摘要

使用卷积神经网纲预测人类评分的分布(predict the distribution of human opinion scores using a convolutional neural network)

图像评分可靠、与人类的认知高度相关,并能辅助图像质量优化、增强(not only score images reliably and with high correlation to human perception, but also to assist with adaptation and optimization of photo editing/enhancement algorithms in a photographic pipeline)

无需参考图像(without need of a “golden” reference image)

1 引言

技术质量评价(technical quality assessment):衡量图像低层次衰退(measuring low-level degradations),如噪声、模糊、压缩伪影等

审美评价(aesthetic assessment):量化(quantify)图像中与情感和审美(emotions and beauty)相关的语义层面特征(semantic level characteristics)。

图像质量评价(image quality assessment)分为全参考(full-reference)和无参考(no-reference):有参考图像时,评价指标可采用PSNR、SSIM;无参考方法利用失真统计模型预测图像质量(blind (no-reference) approaches rely on a statistical model of distortions)。

A 相关工作

B 本文贡献

相比图像高、低评分分类(classifying images to low/high score)和平均分回归(regressing to the mean score),本文预测评分的直方图分布(the distribution of ratings are predicted as a histogram),预测结果与人类评分高度相关。

C AVA数据集(A Large-Scale Database for Aesthetic Visual Analysis)

在这里插入图片描述
在这里插入图片描述

D TID2013数据集(Tampere Image Database 2013)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2 方法

本文提出的质量、美学预测器以图像分类器为基础网络(the quality and aesthetic predictor stands on image classifier architectures),如VGG16、Inception-v2、MobileNet。

将CNN基础网络(baseline)的输出层替换为10个神经元(10 neurons)的全连接层(a fully-connected layer)并采用softmax激活。

在这里插入图片描述

训练阶段:将输入图像缩放至 256 × 256 256 \times 256 256×256(rescaled to 256 × 256 256 \times 256 256×256)、随机裁剪 224 × 224 224 \times 224 224×224区域并随机水平翻转(horizontal flipping)。

本文目标是预测给定图像的评分分布(the distribution of ratings) p ^ \hat{\mathbf{p}} p^。人类对给定图像评分的真实分布(ground truth distribution)可表示为经验概率质量函数(an empirical probability mass function)

p = [ p s 1 , ⋯   , p s N ] , ∑ i = 1 N p s i = 1 ,   s 1 ≤ s i ≤ s N \mathbf{p} = \left[ p_{s_1}, \cdots, p_{s_N} \right], \sum_{i = 1}^{N} p_{s_i} = 1, \ s_1 \leq s_i \leq s_N p=[ps1,,psN],i=1Npsi=1, s1si

目 录 第一章 引言 1 1.1 图像质量评价的定义 1 1.2 研究对象 1 1.3 方法分类 2 1.4 研究意义 3 第二章 历史发展和研究现状 4 2.1 基于手工特征提取的图像质量评价 4 2.1.1 基于可视误差的“自底向上”模型 4 2.1.1.1 Daly模型 4 2.1.1.2 Watson’s DCT模型 5 2.1.1.3 存在的问题 5 2.1.2 基于HVS的“自顶向下”模型 5 2.1.2.1 结构相似性方法 6 2.1.2.2 信息论方法 8 2.1.2.3 存在的问题 9 2.2 基于深度学习的图像质量评价 10 2.2.1 CNN模型 10 2.2.2 多任务CNN模型 12 2.2.3 研究重点 15 第三章 图像质量评价数据集和性能指标 16 3.1 图像质量评价数据集简介 16 3.2 图像质量评价模型性能指标 17 第四章 总结与展望 19 4.1 归纳总结 19 4.2 未来展望 19 参考文献 21 第一章 引言 随着现代科技的发展,诸如智能手机,平板电脑和数码相机之类的消费电子产品快速普及,已经产生了大量的数字图像。作为一种更自然的交流方式,图像中的信息相较于文本更加丰富。信息化时代的到来使图像实现了无障碍传输,图像在现代社会工商业的应用越来越广泛和深入,是人们生活中最基本的信息传播手段,也是机器学习的重要信息源。 图像质量是图像系统的核心价值,此外,它也是图像系统技术水平的最高层次。但是,对图像的有损压缩、采集和传输等过程会很容易导致图像质量下降的问题。例如:在拍摄图像过程中,机械系统的抖动、光学系统的聚焦模糊以及电子系统的热噪声等都会造成图像不够清晰;在图像存储和传输过程中,由于庞大的数据量和有限通讯带宽的矛盾,图像需要进行有损压缩编码,这也会导致振铃效应、模糊效应和块效应等图像退化现象的出现。所以,可以说图像降质在图像系统的各个层面都会很频繁地出现,对图像质量作出相应的客观评价是十分重要且有意义的。为了满足用户在各种应用中对图像质量的要求,也便于开发者们维持、控制和强化图像质量,图像质量评价(Image Quality Assessment,IQA)是一种对图像所受到的质量退化进行辨识和量化的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值