在介绍语音质量的测量方法之前,首先将对语音质量的度量标准MOS进行简要介绍;VoIP呼叫质量会受噪声、畸变、信号幅度过高或过低、回声、通话间隙和许多其他问题的影响。在测量呼叫质量时,需要研究三类基本的服务质量:
(1)收听质量——指用户对呼叫过程中所听到的声音质量的评价。
(2)会话质量——指用户在整个通话过程中基于收听质量和会话能力而对呼叫作出的评价,包括回音和延迟等可能影响通话的相关问题。
(3)传输质量——指用于承载话音信号的网络连接的质量。传输质量测量是与细节呼叫质量测量相对的一种网络服务质量测量。
呼叫质量测量的目的是通过主观或客观的测量方法,即通过人为的测量项目或基于计算机的测量工具,对一种或多种以上的呼叫质量类别给出一个可信的估计。
主观测量是一种久经考验的话音质量测量方法,但这种方法成本太高,费时也太长。有一种更广为人知的主观类测量方法,叫做绝对种类定级(Absolute Category Rating,ACR)测量。
在ACR测量中,收听者按照从1~5的5级损伤指标对一系列音频文件进行分级(见表1)。
在取得了每个收听者给出的得分之后,计算所有音频文件的一般或平均意见得分(Mean Opinion Score, MOS)。为了使ACR测量得到可信的测量结果,接受测量的人数至少应在16个以上,而且测量应该在一个安静的环境下,在可控的条件下完成。这种测量方法定义在ITU-T P.800当中,该MOS值就是语音质量的度量尺寸,显然是MOS越大,语音质量越好。
语音质量测量方法的发展
上述IUT-T P.800中所定义的方法得到的MOS值是一种主观的测量方法,并且该方法成本太高,费时太长;因此,在后来的研究和探索中,先后出现了如下几种客观测量方法:
此外,有必要指出,平均主观值MOS是广泛认同的语音质量标准。因此,无论采用何种方法,所有测量方法所得到的结果都必须对应到最终的平均主观值MOS。
(1)收听质量——指用户对呼叫过程中所听到的声音质量的评价。
(2)会话质量——指用户在整个通话过程中基于收听质量和会话能力而对呼叫作出的评价,包括回音和延迟等可能影响通话的相关问题。
(3)传输质量——指用于承载话音信号的网络连接的质量。传输质量测量是与细节呼叫质量测量相对的一种网络服务质量测量。
呼叫质量测量的目的是通过主观或客观的测量方法,即通过人为的测量项目或基于计算机的测量工具,对一种或多种以上的呼叫质量类别给出一个可信的估计。
主观测量是一种久经考验的话音质量测量方法,但这种方法成本太高,费时也太长。有一种更广为人知的主观类测量方法,叫做绝对种类定级(Absolute Category Rating,ACR)测量。
在ACR测量中,收听者按照从1~5的5级损伤指标对一系列音频文件进行分级(见表1)。
在取得了每个收听者给出的得分之后,计算所有音频文件的一般或平均意见得分(Mean Opinion Score, MOS)。为了使ACR测量得到可信的测量结果,接受测量的人数至少应在16个以上,而且测量应该在一个安静的环境下,在可控的条件下完成。这种测量方法定义在ITU-T P.800当中,该MOS值就是语音质量的度量尺寸,显然是MOS越大,语音质量越好。
语音质量测量方法的发展
上述IUT-T P.800中所定义的方法得到的MOS值是一种主观的测量方法,并且该方法成本太高,费时太长;因此,在后来的研究和探索中,先后出现了如下几种客观测量方法:
- PSQM /PSQM+:Perceptual Speed Quality Measure,感知通话质量测量[2],定义在ITU-T P.861当中;
- PESQ:Perceptual Evaluation of Speed Quality,感知评估通话质量测量[3],定义在ITU-T P.862当中;
- PAMS:Perceptual Analysis Measurement System,感知分析测量,英国电信定义;
- E-Model:本文将重点介绍的测量方法,该方法定义在ITU-T G.107当中。
- 不是基于IP网络的方法,不能反应IP网络的衰减问题,如网络传输中的Delay和Jitter和Packet Loss等问题;
- 不能说明End-to-End的网络延迟,而其他过多的延迟因素影响到了MOS值;
- 只能输出在任何时间内的某一方向的语音质量,不是真实通话中的双向结果;
- 无法模拟多个或成百上千个重复同步的通话。
此外,有必要指出,平均主观值MOS是广泛认同的语音质量标准。因此,无论采用何种方法,所有测量方法所得到的结果都必须对应到最终的平均主观值MOS。