媒体测试心得

媒体即传输信息的媒介,这里讨论的媒体指狭义的传输介质,特指在IP网络传输的音频和视频等内容。当前各种通信平台、软件均涉及音视频媒体的处理,对这类与人的主观感受强相关的系统进行测试

尤为特别。当然,在网络中传输媒体,也离不开对其底层媒介进行测试,这里把测试目标分成两层,底层即网络传输层(即OSI 7层模模型,物理层、数据链路层、网络层),上层为应用层(承载音视

频内容),本文重点描述对后者的测试思路。


1 、音频媒体的测试
由于网络的带宽属性和语音的实时性传输以及质量要求,音频媒体传输使用了多种不同编码以适应不同传输条件,例如窄带编码G711A、G711U、G729、AMR-NB、iLBC等,宽带编码AMR-WB等,G711系列语

音保存信息较完整,但占用带宽较大,AMR占用带宽小,且可根据网络环境变更传输速率,iLBC抗丢包较好等等。

因此我们的测试重点即在于对于VOIP的QoS质量测试,需要覆盖不同编码、模拟不同网络环境进行验证,从而测试系统语音处理能力。目前评价标准有MOS主观和客观评价标准(见本文最后注释),考虑

主观评价需要对人进行训练以及不同类语料选取,另外又无法自动化,成本较高,因而选择后者,目前常用有PESQ评价算法,可以针对给出每种编码在不同环境下的分值。

a、不同系统形态,测试重点、方法也不同
系统涉及到语音处理的形态主要有P2P或者树型结构等,如下图  

 

             

 


点对点即系统只须处理一路媒体流收发,常见的有IP网上互通的终端,QQ等;

树形结构,即系统要处理多路媒体流的收发,并且对多路媒体流进行整合,常见的有多方通话、会议;RTP协议里同样也定义了一种多流模型;

对前者的测试重点要不同编码处理能力(协议),后者测试还要关流系统的特殊功能,多方通话和会议都涉及到混音功能;

传统语音系统功能应还有发送静音、舒适噪音的功能等,测试也须同时覆盖;

b、应用层承载协议的测试
RTP协议是目前比较成熟的媒体承载协议(RFC1889、3550),包括传输协议和传输控制协议RTCP,针对协议的测试,可独立于媒体编码,完全按照协议定义的模型、字段等;
例如,RTP对单流的处理要求,实时有序,因而可结合网络损伤构造丢包、乱序测试系统的容错能力;几个关键报头字段的取值,如时戳、序列号、同步源的取值边界、增长步长(跳变)下,系统的处

理能力。


c、不同音频编码测试思路
对系统编解码器的测试,即对不同音频算法的测试,测试上应强调端到端测试,针对不同编码测试重点稍有不同;
G711A/U - 占用带宽最大编码,编码速率达64kbps,编解码能力转强的系统允许不同打包时长和多帧,因而可根据实际系统的能力要求进行验证;
G729 - 速率达8khz,测试思路同G711A
G723 - 同上
AMR - 自适应多速率,多用于移动通信这种带宽需求小的网络,速率范围12.2kbps~4.75 kbps,除不同速率覆盖,还有不同速率感知、切换功能;
EVRC - 同AMR;
iLBC - 有20ms、30ms两种模式,优势在于对丢包的处理能力,测试重点在和丢包网络模型结合,评估系统能力;


d、不同网络环境对系统容忍能力的验证
语音的感受直接关系到通过质量,时延、丢包、抖动等几种网络常见状态直接影响传输Qos,进而影响质量。

时延,有统计说明时延>100ms,就感觉对方说话不自然,反应有点迟钝,时延>250ms,通话基本无法进行;因此通信经过系统的处理时延在扣除网络其它设备的传输时延下,控制自身的处理时延,测试

评估系统的处理时延;

抖动,由于RTP协议并没有提供服务质量保证,它依赖于低层服务去实现这一过程,因而从发送方到接收方经过传输网传输,到达接收方可能出现媒体包到达时延不一致,甚至乱序,一般的系统都有

Jitter Buffer一定程度对抖动进行容忍,同时也增加了时延;对JB的测试可构造抖动处理后的报文注入根据输出结果评价系统,输出包括处理时延以及最后的质量评分;

丢包,在网络设备传输不可避免存在拥塞、丢包等特点,对系统的丢包补偿能力测试,可构造不同级别的丢包率,结合不同编码,区分不同场景进行评价。

 

2、视频媒体的测试
视频区分于音频,其传输带宽更大、处理更复杂(时延更长)、对网络状况更敏感、实时性要求更高,传输速率具有突发的特点,当前常用的编码有H263、H264、MPEG等系列编码。由于目前没有统一的

标准评价视频质量,更行之有效的方法是通过人(经过特殊训练)来评价视频质量。
不同编码的打包格式可根据协议进行测试,并自动化。
自动化上对于标清视频,可以关键帧上打上标识,判断经过系统处理的图象效果。
此外,音视频唇音同步能过人主观感受判别。

 

3、传输层测试
这里传输层泛指IP网络底层,包括MAC层、IP层、TCP/UDP层,这里除了协议一致性的验证,还需结合媒体编码进行测试,例如最大帧(视频)、IP分片(视频)等。


4、测试组网

 

 

第一张图发送媒体,通过接收媒体与预期比较;第二张图,类似广播,直接对把接收媒体和预期进行比较

 


注释:
主观MOS分评价方法 -- 摘自未知博客
ITU-TP.800 和P.830定义MOS(Mean Opinion Score)的主观测试方法: 由不同的人分别对原始语料和经过系统处理后有衰退的语料进行主观感觉对比,得出MOS分,最后求平均值,这是一种纯粹主观

的定性测量。ITU-T选取在很宽的听觉范围内,不同年龄、性别和语言组别的相同得分,作出语音质量的判别标准。
ITU-T 建议 MOS值的评分范围为[1,2,3,4,5]共5个等级:

MOS分值 主观意见 听觉感受

4-5分 优秀(excelent) 很好,听的清楚,延迟很小,交流流畅

3-4分 良好(good) 稍差,听的清楚,延迟小,交流欠缺顺畅,有点杂音

2-3分 一般(fair) 还可以,听不太清,有一定延迟,可以交流

1-2分 差(poor) 勉强,听不太清,延迟较大,交流重复多次1分以下 很差(bad) 极差,听不懂,延迟大,交流不通畅

而客观MOS评价则采用ITU-T P.862建议书提供的PSEQ方法,由专门的仪器(如Agilent的VQT测试仪)或软件进行测试。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值