视频质量评判标准

轻舞飞扬SR

已于 2022-03-08 13:21:47 修改

阅读量6.2k

点赞数 4

分类专栏： HEVC 文章标签： hevc MOS DSCQS 视频压缩客观评价

于 2020-02-16 01:47:40 首次发布

本文链接：https://blog.csdn.net/starperfection/article/details/104230851

版权

HEVC 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

压缩，一共有两种，一种是有损压缩（lossy compression），一种是无损压缩（lossless compression）。有损压缩是指把编码后的比特流重新正确还原后跟原始文件存在差异，这个差异就是“损失”；而无损压缩指的是把编码后的比特流正确还原后能得到完整的原始文件，恢复文件与原始文件中不存在差异/损失。无损压缩一般应用在重要文件传输，例如医疗资料，军事文件，这类文件不允许任何传输或者存储错误，复原后的文件必须保证100%的正确还原。而我们日常生活中一般都是有损压缩，比如网上观看的视频，收听的音乐等都是有损压缩的。

在视频压缩编码领域，绝大部分情况都是采用有损编码，比人眼感觉不到的，很难感觉到的部分索性去除，在保证画质的前提下，同时减少需要传输的数据，缩减需要用于存储的空间。但是，对于有损压缩而言，压缩率越高，压缩后的文件虽然越小，但是损失就越多，与此同时，视频的画质也随之下降。对于一个优秀的编解码器，当然是压缩率越高越好，压缩后的视频的画质越高越好。所以，对于视频压缩的评判准则就少不了。

视频的画质评价可以分为两类：以MOS测试进行评价的主观性评价和以计算PSNR的客观性评价。

客观评价 Objective

客观评价是以标准的数学公式计算原视频与解码出的视频之间的差异，当今被广泛使用的评判标准是PSNR，其全称为（Peak Signal to Noise Ratio）原理是利用原视频与有损压缩后产生的损失之间的比例来判断的。公式为：
PSNR计算公式
其中，MAX为视频使用的信号的最大值，如视频是8比特的话，那MAX就为255。单位是分贝（dB），MSE为均方误差（Mean Squared Error）即原始图像与解码后的重建图像之间的误差，误差越小，则表示还原后的质量越好，那PSNR就越大。

PSNR的计算仅仅适用于有损压缩，对于无损压缩，因为MSE值将为0，则除式的值将为无穷大，所以对于无损压缩，PSNR是不适用的。

为了评价一个编解码器的性能，不能仅仅靠PSNR，也需要同时考虑压缩后得到的比特流的比特率（bitrate），这样，同时将PSNR和比特率都考虑到的率失真计算就可以但此重任。率失真的计算其实可以简单地理解为编码两个视频后得到的比特流，如果PSNR相同，那么比特少的编码器则更优，如果两者使用的比特数相同，那么PSNR高的编码器则更优。

Bit-rate matric

依据HEVC共同测试田间（CTC：Common Test Condition），在提交提案的时候，通常是测试22，27，32，37这4个QP，编码后，得到比特率，然后解码后，得到重建视频，与原视频相比，就可以得到PSNR，下面是用测试B影像 Kimono 进行测试得到的结果。

type	Reference Bitrate	Reference Y PSNR	Test Bitrate	Test Y PSNR
22	5896.18	41.50	5234.59	41.52
27	2674.00	39.46	2354.27	39.50
32	1270.53	36.99	1150.40	37.03
37	616.12	34.46	580.83	34.70

从上表看到，经过改动的编码器（Test）相应的Bitrate相比起Reference有所降低，而灰度PSNR有所上升。

主观评价 Subjective

视频质量不仅仅要靠客观的统计数字来进行评判，也要靠人的主观判断来进行评判，毕竟，视频最终是要给人看的，客观评价得到的结果再好，如果没有适用人类视觉系统，那么我们最终看视频的体验也是不好的。所以一个视频进行编码重建以后，组织实验员来进行人眼判断质量也是重要的。

MOS测试，Mean Opinion Score Test，组织一定数量的人，尽可能地组织不同类型的人，尽量给实验制造随机性，多样性，使实验更具有一般性，可信性。

进行客观性评价的时候，测试对象坐于显示器前，每位测试对象可以坐得有远近，方向角度有不同，尽量模仿实际生活中的人群，操作者在前方显示器上播放影像，当然，播放也是有规矩的。
MOS测试时间流程
上图中，按时间顺序，一共分为两个阶段，一个是左边的前期测试阶段（没有任何标注），另一个是右边的投票阶段（标注有vote），其中，T1，T3时间段均是播放影像的时间，T2，T4均是休息的时候（显示器上显示灰色）。

在测试中，一共有两种影像，一个是原始影像，没有失真的，一个是测试影像，带有失真的，上图中第一个T1和第二个T1播放同一种影像，第一个T3和第二个T3播放同一种影像，到底是原始影像还是测试影像，随机！测试者无法提前得知。

等过完前面的前期测试阶段后，在Vote阶段，被测试者们就需要对影像进行打分了（即Vote），打分的图一般采用DSCQS方式评分图。
DSCQS评分图
上面就是DSCQS打分图，27，28，29，30，31是视频编号，这里可以对五组（原图+测试）视频进行打分，针对每一对，当进行到Vote阶段的时候，Vote阶段第一个T1过完，在A栏打分，Vote阶段T3过完，给B栏打分。