那就一鼓作气,再更一篇关于IQA 模型的评价指标,以下从综述里面提取整理的
IQA 模型的性能通常从预测准确性、单调性和一致性 3 个方面进行评估
这三个评价指标分别是:皮尔 逊线 性 相 关 系 数 ( Pearson linear correlation coefficient,PLCC ) 、 斯 皮 尔 曼 等 级 相 关 系 数 ( Spearman rank-order correlation coefficient,SRCC) 和均方根误 差( root mean square error,RMSE)
-
皮尔逊线性相关系数 ( Pearson linear correlation coefficient,PLCC )
PLCC 用于 评 估 IQA 模 型 预 测 的 准 确 性。 在 计算 PLCC 前,需对客观分数和主观分数进行非线 性回 归 操 作。用 于 非 线 性 回 归 的 logistic 函 数 计算为
式中,Q 表示原始的客观质量分数;p 为经过回归操 作的客观质量分数;β1 ,β2 ,β3 ,β4 和 β5 为模型参数。 PLCC 计算为
式中,si 和 pi 分别表示第 i 幅图像的主观质量分数 及客观质量分数, s和 p 分别表示主观质量分数平 均值和客观质量分数平均值。 -
斯皮尔曼等级相关系数 ( Spearman rank-order correlation coefficient,SRCC)
SRCC 用于衡量 IQA 模型预测结果的单调性, 其计算式为
式中,N 表示样本数量;di 表示第 i 幅图像主观质量 分数排名与客观质量分数排名的差值。 -
均方根误差( root mean square error,RMSE)
RMSE 用于评估 IQA 模型预测的一致性,其计 算式为
另外3 种新的评价指标,分别为原始图 / 失真图可辨别性测试( D-test) 、基于序列排序一致性测试( L-test) 和配对偏好一致性测试( P-test) 。
(这里主要简介后两种,因为我大概觉得第一种我用不上,偷个懒~)
-
基于序列排序一致性测试( L-test)
L-test 的目的是评估 IQA 模型在对具有相同内 容、相同失真类型但不同失真程度的图像进行评级 时的鲁棒性。 假设图像质量在任意失真类型下随失 真水平的增加而单调下降。 若一个数据库包含 M 幅图像、N 种失真类型和 L 种失真水平,使用平均 SRCC 系数来衡量排序的一致性,具体计算式为
式中,lij和P ij分别表示第 i 幅失真类型为 j 的失真图 像的失真水平和模型预测分数。 -
配对偏好一致性测试( P-test)
P-test 比较 了 IQA 模 型 在 质 量 可 分 的 图 像 对 ( quality-discriminable image pairs,DIPs) 上的偏好预 测。 在图像对的偏好预测上,一个好的 IQA 模型应 该与 DIPs 具有一致性。 假设 DIPs 的数量为 Y,模型 预测正确的 DIPs 数量为 Yc,配对偏好一致性比率的 计算式为
式中,指标 P 越接近 1,表示 IQA 模型的性能越好。
好的,今天就先这样,明天继续努力!!!