- 语音编码分类
(1)波形编码: 以逼近声音波形为目标,其代表算法有G.711,其声音清楚度好,语音的自然度高,但是压缩效率比较差,常在32kbps以上。
(2)参数编码: 将人的声道抽象成一个发声模型,对这个模型的参数进行编码,其特点是压缩效率高,但是自然度比较差,能够以极低速率进行编码。
(3)波形参数混合编码: 结合了波形编码和参数编码的优点,代表算法有G.723, G.729等,能够在4-16kbps速率进行高质量语音合成。 - G.711
也称为PCM(脉冲编码调制),是国际电信联盟订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。 起压缩率为1:2, 即把16位数据压缩成8位。G.711是主流的波形声音编解码器。
G.711 标准下主要有两种压缩算法。一种是µ-law algorithm (又称often u-law, ulaw, mu-law),主要运用于北美和日本;另一种是A-law algorithm,主要运用于欧洲和世界其他地区。其中,后者是特别设计用来方便计算机处理的。这两种算法都使用一个采样率为8kHz的输入来创建64Kbps的数字输出。G.711采用一种称为分组丢失隐藏(PLC)的技术来减少丢包带来的实际影响。有效的信号带宽在静默期间通过语音活动检测(VAD)这一过程被减小。
8KHz采样率 X 16bit量化 = 128Kbps , 2:1压缩后为64Kbps
G.729
G.729是ITU-T定义的音频编码算法,frame 只有10msÿ