一、前言
摆在面前的一个问题:视频会议在大规模使用后,如何评估、如何监控线上视频质量?
视频质量的评估方法通常有有参考评估
、无参考评估
、半参考评估
。其中:
- 有参考评估需要原始视频和经过损伤的有损视频,通常原始视频不易获取,并且评估耗时较多;
- 无参考评估仅需要有损视频即可进行,但结果与主观打分的符合度相对有参考要差一些,但好在耗时不多;
- 半参考评估比较鸡肋,虽然不需要原始视频,但需要原始视频的部分信息,评估既没有有参考准确,也没有无参考简单。
最终选择的方案是:在客户端计算无参考分数、伪实时上报到监控系统,另外,无参考评估使用G.1070
。
G.1070
是ITU
组织2007年发布,于2012年进行了改进更新,相对来说具有以下优点:
- 是ITU发布的音视频质量无参考评估的标准,评价结果可信度较高;
- 实验基于H.264和MPEG-4编码器,包含客户端采用的编码器;
- 相关影响因子比较少,公式计算简单。(基于
码率
、帧率
、丢包率
以及不同条件下的常系数
来计算MOS分数); - 不仅支持单独对视频进行无参考评估,也支持单独对音频进行无参考评估以及整合视频和音频评估结果。后面音频无参考评估扩展也比较容易。
关于
G.1070
的其他官方描述、算法实现、参数拟合等,可以参考 ITU G.1070标准,选择最新的2018年06月的版本。
二、标准如何落地
G.1070
提供的计算无参考分数的公式非常简单,只需要根据视频的码率
、帧率
、丢包率
再加上12个常系数
就可以计算出该条件下的视频无参考分数
。码率、帧率、丢包率都容易获取,ITU提供了一些不同编码器和不太常见的视频分辨率下的常系数,但是这些分辨率通常不是视频会议中使用的分辨率。特定编码器和特定分辨率下的常系数该如何确定?
在上文提到的
ITU G.1070标准文档
的附录A提供了一种通过最小二乘法
拟合常系数的方法,这一部分主要是对该方法的解释介绍。(我相信一定有人像我最开始一样,即使拿着文档,用Google翻译,也看不懂老外对数学方法的描述):
1、计算公式是怎样的
其中:
Vq
代表无参考MOS分数;Pplv
代表百分制丢包率,比如10%丢包,Pplv就是10; <