语音压缩算法测评及质量评估

本文介绍了语音压缩的基本依据,包括幅度非均匀分布、样本间的相关性、周期之间的相关性和基音之间的相关性,阐述了这些特性使得语音压缩编码成为可能。语音压缩在通信系统中广泛应用,缓解了信道紧张的问题。同时,文章概述了语音压缩技术的发展,包括波形编码、参数编码和混合编码,以及它们在不同场景下的应用和优缺点。
摘要由CSDN通过智能技术生成

1.语音压缩的基本依据

从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析的结果,语音信号中存在着多种冗余度m,主要有以下几个方面:

1. 幅度非均匀分布

语音中小幅度样本比大幅度样本出现的概率要高。又由于通话必然会有间隙,更出现了大It的低电平样本。此外,实际语音信号的功率电平也趋向于出现在编码范围的较低电平端。因此,语音信号的幅值分布是非均匀的。

2. 样本之间的相关性

对语音信号的波形分析表明to,采样数据的最大相关性存在于邻近样本之间。当采样速率为8KHz时,相邻采样值之间的相关系数大于0.85,甚至在相距十个样本之间,相关系数还有0.3左右的数it级。如果采样速率提高,样本间的相关性将更强。

3. 周期之间的相关性

虽然电话语音信号的频率分布在300-3400Hz的频带内,但在特定的瞬间,某一声音却往往只是该频带内的少数频率分I起作用。当声音中只存在少数几个基本频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。

4. 基音之间的相关性

语音可以分为清音和浊音两种基本类型.浊音是由声带振动产生,每一次振动使一股空气从肺部流进声道。激励声道的各股空气之间的间隔称为基音周期。浊音的波形对应于基音周期的长期重复波形。因此,对语音浊音部分编码的有效方法之一是对一个基音周期波形进行编码,并以它作为其它基音段的模板。此外,电话通信中还有很大的话音间隙。通话分析表明,语音间隙约占通话时间的60%。这本身也是一种冗余。

正是由于语音信号具有以上特点,对语音的压缩编码才成为可能。在现今的通信系统当中,各种语音压缩编码得到了广泛的应用,并形成了一系列的语音编码标准。语音压缩编码技术大大缓解了信道紧张的状况。

2.语音压缩技术的发展概况

语音编码器的主要功能就是把用户语音的PCM(脉冲编码调制)样值编码成少量的比特(帧)。这种方法使得语音在链路产生误码、网络抖动和突发传输时具有健壮性。在接收端,语音帧先被解码为PCM语音样值,然后再转换成语音波形。

语音信号的数字编码方法主要分成三类:波形编码、参数编码和混合编码,其编码质量大致如图2所示,表2给出了各种编码方法的典型例子。波形编码是对语音时域或频域波形进行编码,由于这种系统保留原始样值的细节,从而保留了信号的各种过度特征,因此解码声音质量较高,但此系统编码码率较高,压缩比不大。参数编码的基础是利用人类语音的生成模型,这样在传输过程中只需要传送模型的参数,大大降低了系统的码率,特别适合于无线通信,保密和军事通信领域。参数编码的缺点在于恢复的语音质量较差。采用参数编码方法的编码器有时称为声码器

正因为上述两种编码存在着不足,因此人们又想到了混合编码的方法。混合编码是波形编码和参数编码的结合。它既利用了语音的生成模型,减少了传输码率,又使解码的语音产生接近原始语音的波形,以保留说话人的各种自然特征,因此当前各种国际标准通常采用这种方法。

第一个语音压缩系统是1939年贝尔实验室的H.Duddlyf发明的通道声码器.1938Reeves提出PCM(脉冲编码调制)编码,后来成为现代电话系统的常规语音编码方式,1977年被ITU-T采用为G.711标准建议。64Kbps速率的PCM方式,采样速率为8K,每个采样点盆化为8 bit。现在所说的语音压缩编码,都是相对于64KbpsPCM标准而言。1946Delorain提出了增量调制(OM), 1952年贝尔公司的Culter取得了差分脉冲编码调制(DPCM)的专利。为了进一步降低编码速率,以后又陆续提出了一些编码方案。1988年制定的G.722建议采用32KbpsADPCM 编码,虽然码率较高,但是实现简单,且音质很好,在目前的ISDN系统中仍然使用这一编码方案.1992年制定的ITU-T G.728建议,采用LD-CELP(低延迟码激励线性预测),编码速率达到16Kbps, 1995年制定的G.723.1建议,采用改进的激励线性预测编码,编码速率达到5.3/6.3Kbps。目前,欧洲的GSM通信系统采用的是13KbpsRPE-LTP(规则脉冲激励长周期预测)压缩编码方案,同时正在开发6.5KbpsCELP方案作为它的半速率标准方案。近年来,低比特率语音编码(8Kbps以下)的研究取得了很大的飞跃.美国先后公布了4.8KbpsCELP编码,2.4KbpsMELP编码,目前甚至出现了速率在1Kb ps左右的语音编码算法noimi由于这些算法的延时都比较大,一般在20-80ms,还没有被采用为国际标准。随着算法的进一步改进,其应用前景将更加广阔。

3.

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值