2018NIMA_ Neural Image Assessment阅读笔记

前言

笔记最初是在有道云做的,没用markdown编写,时间原因,前面先上笔记截图吧。不影响阅读。有时间补上文字版。

笔记截图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

文字(未补图)

  1. While technical quality assessment deals with measuring low-level degradations such as noise, blur, compression artifacts, etc., aesthetic assessment quantifies semantic level characteristics associated with emotions and beauty in images.
    技术质量评估涉及测量噪声,模糊,压缩伪像等,美学评估量化了与图像中的情感和美感相关的语义级别特征。

  2. weights are initialized by training on classification related datasets (e.g. ImageNet [15]), and then fine tuned on annotated data for perceptual quality assessment tasks.
    由图像分类相关数据集(训练的模型)初始化权重(例如ImageNet),然后使用感知质量评估任务的标注数据进行微调。

  3. blind quality assessment
    无参考评估

  4. semantic level qualities are directly related to image content
    语义级别质量与图像内容直接相关

  5. 数据集一:AVA Dataset
    I、这里的AVA Dataset 是什么?
    一个美学质量评估的数据库(目前33.14Gb),大约有255000张照片。每一张照片,都有多人参与的评分,以及语义级别的label;
    60多个类别的语义标签以及与图像质量相关的摄影风格标签分类。

II、 AVA Dataset都做了什么标注?
Aesthetic annotations(人类审美)

  • 每一张图,若干人投票,一张图平均200个人投票。投票的分数0~9,分值越高,说明图片质量越高;
  • 并且,标注者中不止包括了专业的图像工作者,摄影师,也包括了摄影爱好者,这样显得更有普适性。
  • 平均得分5.5
    Semantic annotations(语义标注)
  • 就是图像中到底包含了什么内容。具体来说,这个数据集包含了66个textual tags。大概有200000张图只包含一个tags,150000张图包含2个tags。
  • 有的是描述图像的内容,比如说,水果,自然风景,人物,建筑等等;
  • 有的是描述图像的风格,比如black and white。
  1. Photographic style annotations(摄影风格标注)
  • 摄影美学,专业角度
  • 下面列出了所有属性,以及包含该属性的图片数量。
    Complementary Colors - 互补色(949), Duotones - 双色调(1,301), High Dynamic Range - 高动态范围图像(396), Image Grain (840), Light on White (1,199), Long Exposure (845), Macro (1,698), Motion Blur (609), Negative Image (959), Rule of Thirds (1,031), Shallow DOF (710), Silhouettes (1,389), Soft Focus (1,479), Vanishing Point (674).
  • 比如Complementary Colors:互补色,是成对的颜色,当组合时,相互抵消。这意味着当组合时,它们会产生灰度色,如白色或黑色。

AVA Dataset可参考:简书——言有三:https://www.jianshu.com/p/50da0dd4bf19
III、数据集方差
方差小,这说明大家比较能达成一致,
方差大,这说明有些人认为很好,有些人认为很差。

  1. a novel approach to predict both technical and aesthetic qualities of images.
    一种对图像进行图像技术和美学质量预测的新方法。[这两个是分开训练的]

  2. we aim for predictions with higher correlation with human ratings, instead of classifying images to low/high score or regressing to the mean score, the distribution of ratings are predicted as a histogram
    我们的目标是得到与人类评价关联度更高的预测值,而不是(简单的)将图像分类为低/高分或回归到平均得分,因此评级的分布被预测为直方图。

  3. Given the distribution of AVA scores, typically, training a model on AVA data results in predictions with small deviations around the overall mean (5.5).
    考虑到AVA数据评分的分布,通常,在AVA数据上训练模型会导致预测时整体平均值(5.5)周围的偏差很小。

  4. 数据集二:Tampere Image Database 2013

  • 主要是提供一些失真的图像,比如压缩,噪声,模糊和color artifacts之类的失真;
  • 观察者在两个失真图之间选择更好的图像;
  • 在每个实验中,每个失真的图像被用于9个随机的成对比较:所选图像获得一个点,而其他图像获得零点;
  • 在实验结束时,将点的总和用作与图像相关联的质量得分(这导致得分范围从0到9)。为了获得总体平均分,进行了总共985个实验
  1. 数据集三:E. LIVE In the Wild Image Quality Challenge Database
  • LIVE dataset contains 1162 photos captured by mobile devices. Each image is rated by an average of 175 unique subjects.
    LIVE数据集包含1162张由移动设备捕获的照片。每张图片的平均从175个不同的主题来打分。
  1. Our proposed quality and aesthetic predictor stands on image classifier architectures. More explicitly, w
    我们提出的质量和美学预测模型建立在图像分类模型架构之上。

  2. Baseline network 的权重由ImageNet数据集训练初始化,全连接层(10个神经元)随机初始化

  3. 研究团队对于VGG16、Inception V2(更佳)、MobileNet都进行了实验

  4. 在训练中,输入图像被重新缩放为256×256,然后随机提取大小为224×224的裁剪区域

  5. 算法:

  • 人们对一张图片的评分作为经验概率质量函数:

i是第i类score bucket,N是score buckets数量。落入N类不同得分的概率之和为1。

  • 图像平均得分:

  • 得分标准差

  1. 损失函数:
  • it has been shown that for ordered classes, the classification frameworks can outperform regression models [21], [31]. Hou et al. [21] show that training on datasets with intrinsic ordering between classes can benefit from EMD-based losses. These loss functions penalize misclassifications according to class distances.
    [21],[31]Hou等人已经证明:对于有序类,分类框架可以胜过回归模型。 [21]表明,对于类之间具有内在排序的数据集的训练,可以从基于EMD的损失函数中受益。这些损失函数会根据类之间的距离来惩罚那些错误的分类。
  • 损失函数的重点:
    在这里插入图片描述
### 回答1: iqa-nima是一种针对图像质量评估的深度学习算法,利用神经网络自动学习图像质量的特征,可以准确地评估图像的质量。该算法是基于NIMA(Neural Image Assessment)算法的改进版本,增加了对ISO等其他图像质量因素的考虑。 iqa-nima算法主要包括两个部分:训练阶段和测试阶段。在训练阶段,算法利用已有的高质量图像和对应的主观评价分数训练神经网络,学习图像质量的特征。在测试阶段,通过输入待评估图像,经过神经网络计算得到图像的质量分数,从而进行图像质量评估。 iqa-nima算法采用了效率较高的ResNet架构作为神经网络,在训练阶段引入了数据增强和随机扰动等策略,提高了算法的鲁棒性。在测试阶段,算法还提供了集成多个神经网络的选项,可以进一步提高评估结果的准确性。 总的来说,iqa-nima是一种高效准确的图像质量评估算法,可以广泛应用在图像处理和计算机视觉等领域。 ### 回答2: iqa-nima是一种用于评估图像质量的算法。它基于神经网络,并利用了自然图像的统计规律来预测图像的质量。iqa-nima的全称是“Natural Image Quality Evaluator using Multi-scale Spatial and Spectral Features with Gradient Boosting Machine”。与其他传统的图像质量评估算法相比,iqa-nima具有较高的精度和鲁棒性。在实际应用中,iqa-nima可以用于图像压缩、图像增强、图像复原等场景中,用于判断图像质量改变的程度。iqa-nima的实现过程主要包括图像预处理(将输入图像转换为多尺度和多频段的特征图)、特征提取(利用CNN从特征图中提取空间和频谱特征)、训练模型(采用GBM,构建回归模型进行参数学习和预测)和评估图像质量(将图像输入模型进行预测)。iqa-nima的代码较为复杂,需要深入掌握图像处理、机器学习等相关领域的知识。 ### 回答3: iqa-nima 是一种基于神经网络的图像质量评价算法。该算法使用了深度神经网络模型来学习图像质量的特征,然后预测图像的质量分数。iqa-nima 算法的主要特点是高精度和高效率。与传统的基于数学模型的评价方法相比,它能够更加准确地评估图像质量。 iqa-nima 算法的核心思想是将图像转化为特征向量,然后再将特征向量输入到神经网络模型中进行学习和预测。该模型采用了一种叫做残差模块的结构,使得模型具有更好的拟合能力和泛化能力,从而提高了模型的预测结果的准确性。 此外,iqa-nima 算法还使用了一种特殊的损失函数,称为对比损失函数。该损失函数能够引导模型学习到图像质量的一些高级特征,从而提高了模型的鲁棒性和可靠性。在训练阶段,模型需要学习尽可能地准确地预测每张图像的质量,而在测试阶段,模型可以对新的图像进行评价和预测,从而提供更加准确的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值