语音压缩思路
- 从中通滤波开始,先滤除语音之外的频段。
- 根据香农-乃奎斯特定律,采样率需要为最高频段的2倍,通过步骤1可以降低采样率。
- 用尽可能低的频率进行采样。
- PCM调制与PWM调制。
- 人能够承受的最大动态范围约120dB,AM收音机是48dB,故认为48dB已经足够还原人声。
- 根据6dB规则,使用8位数据字宽既能够满足上述要求,
- 压缩编码方式选择
优先选择:voip使用的LPC(Linear Predictive Coding,线性预测编码)
备用选择:CELP(Code Excited Linear Prediction码激励线性预测编码)
LPC(Linear Predictive Coding,线性预测编码)
类型:Audio
制定者:
所需频宽:2Kbps-4.8Kbps
特性:压缩比大,计算量大,音质不高,廉价
优点:压缩比大,廉价
缺点:计算量大,语音质量不是很好,自然度较低
应用领域:voip
版税方式:Free
备注:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。如:线性预测编码(LPC)及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。