语音编码标准

 1. 波形编码
波形编码是最简单也是应用最早的语音编码方法。最基本的一种就是PCM编码,如G.711 建议中的A 律或μ 律。APCM、DPCM和ADPCM也属于波形编码的范畴,使用这些技术的标准有G.721、G.726、G.727 等。波形编码具有实施简单、性能优良的特点,不足是编码带宽往往很难再进一步下降。
2. 预测编码
语音信号是非平稳信号,但在短时间段内(一般是30ms)具有平稳信号的特点,因而对语音信号幅度进行预测编码是一种很自然的做法。最简单的预测是相邻两个样点间求差分,编码差分信号,如G.721。但更广为应用的是语音信号的线性预测编码(LPC)。几乎所有的基于语音信号产生的全极点模型的参数编码器都要用到LPC, 如G.728、G.729、G.723.1 建议。
3. 参数编码
参数编码是建立在人类语音产生的全极点模型的理论上,参数编码器传输的编码参数也就是全极点模型的参数- 基频、线谱对、增益。对语音来说,参数编码器的编码效率最高,但对音频信号,参数编码器就不太合适。典型的参数编码器有LPC- 10、LPC-10E,当然,G.729、G.723.1 以及CELP(FS- 1016)等码
本激励声码器都离不开参数编码。
4. 变换编码
一般认为变换编码在语音信号中作用不是很大,但在音频信号中它却是主要的压缩方法。比如,MPEG 伴音压缩算法(含著名的MP3) 用到FFT、MDCT 变换,AC- 3 杜比立体声也用到MDCT,G.722.1建议中采用的MLT 变换。在近年来出现的低速率语音编码算法中,STC(正弦变换编码)和WI(波形插值)占有重要的位置,小波变换和Gabor 变换在其中有用武之地。
5. 子带编码
子带编码一般是同波形编码结合使用,如G.722 使用的是SB- ADPCM技术。但子带的划分更多是对频域系数的划分(这可以更好地利用低频带比高频带感觉重要的特点),故子带编码中,往往先要应用某种变换方法得到频域系数,在G.722.1 中使用MLT 变换,系数划分为16 个子带;MPEG 伴音中用FFT 或MDCT 变换,划分的子带多达32 个。
6. 统计编码
统计编码在图像编码中大量应用,但在语音编码中出于对编码器整体性能的考虑(变长编码易引起误码扩散),很少使用。对存在统计冗余的信号来说,统计编码确实可以大大提高编码的效率,所以,近年来出现的音频编码算法中,统计编码又重新得到了重视。MPEG 伴音和G.722.1 建议中采纳了哈夫曼变长编码。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值