IP 电话(VoIP)语音质量的定量分析及测量

转自 http://www.ameritec.com.cn/products/IPtest/IPtest.htm


1.  IP电话 (VoP) 网络的结构:

所谓IP电话,即将模拟语音信号通过特定的处理方式转换成数据包信号,然后再将这些数据包通过分组交换网(如Internet、楨中继或ATM)传输,在接收端还原为模拟信号,从而完成整个通话过程。

1所示为一典型的IP电话网络,我们称其“Voice over Packet ”简称(VoP)

 

VoIP网络的典型结构

图中,ABCD均为普通电话用户,其中“A”做主叫呼叫“B”。我们可以看到:电话用户的语音信号(通常认为这一信号的带宽为180~3,600Hz方能代表男人、女人、大人、小孩等人类的语音頻谱)传递的路径为:主叫用户语音信号→PSTN 网关(Gate way) / 路由器 (Router)→分组交换网→网关→PSTN→被叫用户。

现略去读者已熟知的PSTN和分组交换网,仅对图中网关和路由器的作用简介如下:

1.1 网关(Gate Way):网关为一在PSTN和分组交换网之间传输呼叫的器件。其包括语音编码器、回音抑制器、静音抑制;收/发缓存器以及分组交换网的排序管理等组成部分,如图2所示。

 

                 网关结构图

网关主要有二项功能。其一是呼叫的管理,即根据需要完成PSTN和分组交换网之间双向的信令转换。其二是呼叫的处理,即要将PSTN的语音信号按照在分组交换网中传输所需要的格式打包,以便完成双向的信息传输。

1.2    路由器:

路由器实际上是一台工作在第三层的特殊用途的计算机,其是分组交换网中用于将呼叫信号送达指定地址的器件。路由器自网关接收地址信息,确认其有效性(如空闲、忙、已注销、未开通等)后,选择合适的路由。一旦呼叫建立,路由器将打包后的语音信号传递至指定地址。

为了便于随后进行的关于测试方案的讨论,现就图2中出现的有关的术语定义解释如下:

a)  回音抑制:( Echo Cancellation Algorithm)

其定义由ITU-T G.168给出。回音抑制的功能是用相位补偿的方法抵消串入远端发送信号中的远端接收信号。其目标是消除延时超过45毫秒的回声,因为当回音超过45毫秒时,发话方就能够听到反射回来、滞后的自己的声音。

b)  语音活动检测器:(VAD = Voice Activation Detector)

该器件在信号电平低于某一特定的门限值时,将限制数据包的传输,此时其提供空闲(idle)或者“舒适噪音”(Comfort noise) 以避免电话用户感到“断线”(dead air)VAD是当线路状态从空闲变成传递信号时产生“前沿切割”(“Leading edge clipping”)和当线路状态从传递信号变成空闲时产生“后沿切割”(“trailing edge clipping”)的主要因素。

c)  语音编码器:(Voice Coder decoder = Vocder

该器件应用一种对人类语音有特殊功效的压缩算法,将模拟语音转换成数字比特流。语音编码器工作时仅需小于64Kb/s的带宽。这种算法不仅适用于语音的压缩,在增加专门应用软件条件下,它亦可支持调制解调器和传真的应用Fax/Data Modem Over IP。语音编码器在VoP网络中是延时的一个重要因素。

d)       语音压缩算法:(Voice Compression Algorithm)

有效带宽在分组交换网中是宝贵的资源。人类语音交流过程中,通常有50%的时间为静音(Silent) 。为了节约带宽,就必须压缩静音。同时还要使用不同的算法来对普通电话呼叫中的人类语音及其中所含的诸如DTMF等特殊的控制音调转换的指令进行压缩打包,并将其送达接收端。

常用的算法规则定义如下:

G.711:标准的PCM,  3.1 带宽音频编码,485664Kb/s 通道传输

G.7227Kb/s 带宽音频编码,4856、和16Kb/s通道传输

G.723.1:由VOIP组织定义的专门用于在IP网络上传递语音的附加标准。

3.1Kb/s带宽音频编码;5.3 6.3Kb/s通道传输。

G.7283.1Kb/s带宽音频编码, 16Kb/s 通道传输

G.729 & G.729aFrame Relay 组织定义的专门用于在FR传递语音的附加

标准。3.1Kb/s 带宽音频编码,8Kb/s 通道传输。

e)       缓存器(Buffer):

缓存器用于管理信息,使其按顺序从点到点依次通过。在诸如网关这样的器件中,缓存器的功能是处理二个方向的信息流。即:语音编码器和分组交换网之间的发送信息流和分组交换网和语音编码器之间的接收信息流。缓存器通常按需要来设置其容量,而缓存器的溢出和冗余均是导致丢包、延时和抖动的重要因素。 

2.      IP电话(VoP)网络的特殊问题:

与普通电话网比较,VoP网络采用了语音压缩编码,用数据包的形式在分组交换网上传递,因此其对传输线路的时空利用率得到大幅度的提高,这就是IP电话较普通电话话费便宜(主要表现在长途,特别是国际长途上)的主要原因。与此同时VoP遇到的通话性能特别是语音质量问题也是传统电话不曾涉及的。

 如前所述,网关或路由器内部的语音编码器( Vocoders) 对带内音频信号进行了打包和重组。这些器件对确认接收和有效数据包接收的顺序进行纠错检查,一旦发现错误,将命令重发,而重发相关数据包则不可避免地造成传输上的延时。网关或路由器上的另一个重要组成部分缓存器 (Buffer) 即为容纳这些延时的数据包而设置。一般地讲,缓存器的容量越大,数据包被损坏的机率就越小,但同时延时却会增大。这是一对矛盾,需要系统设计和管理者来综合平衡,选择最佳的配置。图3示出了VoP网络中延时的分布情况。

 

VoIP中时延的分布图

在激烈的市场竞争中,QoS (Quality of Service) 是每一个电信运营商刻意追求的指标。事实上目前IP电话的用户都会感觉到通话过程中随时会出现令人难以忍受的语音畸变和频繁的断话现象。产生语音质量恶化的原因主要有以下几个:

l                  VoP网络延时

l       丢包;包括数据包丢失和数据包排序溢出

l                  沿切割和抖动

非常明显,在VoP网络中影响语音质量的因素是由其结构决定的特殊问题,而且各因素之间存在着此消彼长的制约关系。因此,根据电信网络服务质量(QoS) 的要求,建立一套客观评估标准,并对VoP网络的语音服务质量进行定量分析和测量就成为当务之急,摆在了从事这项工作的人们面前。

2.      VoP语音质量的测试:

从以上讨论可以看出:在VoP网络中的语音质量问题是普通电话网中不存在的特殊问题,而且能否对其进行定量的分析测量,依据测量结果对VoP网络中各器件进行调整,使其达到最佳的语音质量已成为决定VoP生存发展的必要条件。

同时,我们也总结出衡量语音质量的四个重要因素参数,即:

l                  延时(Delays),包括单向延时 (One Way delays) 和迴路延时 (Round – trip delays)

l                  丢包 (Dropped – out )

l                  抖动 (Jitter)

l                  沿切割 (Clipping)

根据测试经验和理论分析,若使VoP的语音质量接近普通电话,单向延时的指标最好小于100ms,最大不能超过250ms(见图2),而丢包率不能超过5%

随着VoP技术的发展,人们不断寻求测试的方法,以便能规范VoP设备的技术标准。最初ITU-T P.800提出了MOS (Mean Objection Score)的方法。即请40-60 有代表性的人士来听一段相同的语音样本,然后对该样本经过VoP传输后的语音质量进行投票评价。随着语音因语言、年龄、性别的变化,得分亦被赋与不同的意义。这是一种纯粹主观的定性评估。ITU-T选取在非常宽的听觉范围内,不同年龄、性别和语言组别的相同得分,做出语音质量的判别标准:

5 = 最佳

4 =                   4.5 – 4.0 =  可收费电信级)

3 = 中级               4.0 – 3.5 =  可通话通信级)

2 = 较差               3.5 – 2.5 =  可建立连接级)

1 =

很显然,MOS方法是一种模糊的评估方法,其测试结果很难对VoP系统的改进和不同VoP设备之间性能的比较作出有实际意义的判别。因此ITU-T P.861 中又建议了 PSQM (Perceptual Speech Quality Measurement)方法。

PSQM仍以MOS的五个级别作为标准,所不同的是其对每一个级别都以百分比的方式做出了差---最差(%PoW =Percent Poor or Worse )和好---最好(%GoB = Percent Good or Better)的进一步描述。PSQM方法并未摆脱原始的人类主观评估,只是作了进一步的说明. 而目前有些人使用计算机产生波型文件( Wave File ),通过比较其通过VoP网络传输前后的变化计算出与PSQM中相对应的级别及好坏程度,以此作为评估语音质量的方法。

PSQM无疑比MOS前进了一步,但其实质仍然是一种定性评估的方法,不能准确给出影响VoP网络语音质量的诸因素的量值;而且波形文件不能完全代表各种不同年龄、性别、语言的人类语音通过VoP网络时的真实情况,同时在具体测试中必须令波形文件信号返回方可进行比较,这样就无法测量网络端到端的单向延时,等等这些都是PSQM的局限和缺憾。

显然VoP技术的发展迫切需要一种能定量分析测量其影响语音质量的四个指标的方法和相应仪器设备。

3.      解决方案:

针对VoP网络的特点和对其语音质量测试的要求,国际许多测试仪器设备制造厂家都投入了大量资源进行研究开发,并取得了阶段性成果。如美国Ameritec公司在长期从事电路交换语音测试和模拟语音传输损耗测试 (TIMS) 研究的理论基础上,开发了用于分组交换系统测试的专利技术 Golden Voice ”。

Golden Voice”是一个宽带复合音调发生器,其由24种不同频率、幅度、占空比的单音信号混合调制产生,以确保可靠地通过所有现代的语音编码器和译码器。(如G.711, G.728, G.729, GSM, CDMA 等等)。

Golden Voice”可以做为测试音源,配置在模拟呼叫发生器上,当语音路由建立以后,由呼叫发生器将“Golden Voice”送出,同时对其所带的间隔为1.25ms时标进行计数,从而精确地测量出VoP网络的单向时延、迴路时延和丢包、抖动、沿切割等指标,祥见图4

 

测试解决方案

根据图4所示,目前可以提供的VoP测试功能及指标如下:

4.1 丢包测量 (Dropout  Measurement)

语音丢包检测器可以连续地测量每一个语音通道的音频能量,对检测出的由于打包或桢丢失引起的超过5ms的丢包进行计数,并可对不同长度的丢包进行统计。

4.2 前后沿切割测量(Leading and Trailing Edge Clipping Measurement)

检测网关中相应部件对从静音讲话和从讲话静音之间的过渡状态的响应。

4.3 抖动测量 (Jitter Measurement)

检测瞬间的时序变化,±5ms分辨力

2.4    单向和徊路延时测量(One-way and Round-trip delay Measurement)

各音频通道独立检测,单向±5ms分辨力,迴路±10ms分辨力

不难看出:以上指标测试的精确度和分辨力与“Golden Voice”信号

源中的时标精度直接相关,但如与第三节所述的VoP最好语音质量效果(同普通电话)指标比较,目前的量值已经足够了。

5.  测试分析:

5.1 丢包测试

5 示出了丢包测试的时序图, 图中的复合语音路由测试信号即为“Golden Voice”产生的一种复合语音信号。在测试中,用户可以自行设定分别为5, 10, 15, 25, 50 100ms检测门限值。 一旦呼叫建立后,被叫即将测试音信号送至主叫,(该测试音将覆盖语音编码器的动态范围),而主叫将检测该信号通过VoP后的状态变化。

丢包时序图

如图5 中“ a”处,虽然出现丢包现象,但由于其时间间隔小于设定门限20ms,故在测试中忽略不计。“ b”处出现一个为20ms的丢包,则计数一次。“ c”处出现总长200ms的丢包,则计数器按20ms 值的整数倍统计为10次,依次类推。也就是说,在图5例中,我们检测出在这次呼叫中共出现了11次丢包。

5.2 沿切割、抖动和丢包测试

在分组交换网中,沿切割、抖动和丢包通常是相伴而出的。如前所述,其产生的根源都在语音编码器,因此该三项指标可以在一次测量中完成。图6 示出了沿切割和抖动对信号的影响。用户可以在不少于12个测试信号周期内选择不同的脉冲占空比(如25%50%75%100%)以补偿在“静音”时有可能产生的丢包。测试包括如下:

l                  建立呼叫

l                  被叫应答

l                  被叫送测试信号到主叫

l                  主叫调整脉冲电平

l                  主叫与测试信号同步

l         一旦电平调整与同步完成,开始检测抖动、前沿切割、后沿切割及丢包

 

抖动及沿切割的影响

5.3 延时测量:

单向延时测量过程如下:

l                  主叫发起呼叫

l                  被叫应答

l                  被叫送出长度为100ms的带有时标标记的测试音信号到主叫

l                  主叫检测收到的信号,并对时标进行测量,分辨力±5ms

l                  呼叫完成后,仪器中DSP的将测量数据输出到LGC存储

l         迴路延时测量依此类推,分辨力变为±10ms

2.      结束语:

从以上分析不难看出,目前人们已经找出了一套完整的定量分析测量VoP语音质量的方法和工具。非常显而易见的是:这个方案中定量地分别给出了各项指标的量值,这对于VoP设备制造厂家改进其产品性能具有极其重要的意义。而对VoP网络的运营商来讲,通过计算这些量值来评估语音质量就显得比较繁琐。因此,运营服务商希望能在定量参数分析数据和MOS的评估值间做出一种对应联系,以方便使用。这就需要一个相应的标准文件予以规范。同时,亦有人提出依据ITU P.50规范来判断IP电话网语音质量更科学。总之,由于这项工作在全世界范围内亦刚开始,本文中错误在所难免,欢迎批评指正。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值