语音编码

概述

编码的重要性

  编码、传输、存储和译码是语音数字传输和数字存储的必要过程。
  随着语音通信技术的发展,压缩语音信号的传输带宽,降低信道的传输速率,一直是人们追求的目标。语音编码在实现这一目标的过程中担当重要的角色。
  语音编码就是使表达语音信号的比特数目最小。

编码速率

  用比特/秒(b/s或bps)来度量,用I表示,
  I=R • fs ,R代表每个语音采样值编码所需的比特数;fs是采样频率。
  当fs=8kHz,每个采样值用8比特位来编码,则编码速率为64kb/s。

编码的分类

  语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输,语音编码的基本方法可分为 波形编码参量编码(音源编码)和混合编码,波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号,参量编码是基于人类语言的发音机理,找出表征语音的特征参量,对特征参量进行编码,混合编译码是结合波形编译码和参量编译码之间的优点。波形编译码器虽然可提供高话音的质量,但数据率低于16 kb/s的情况下,在技术上还没有解决 音质的问题。

波形编码

  基本原理是在时间轴上对模拟话音信号按照一定的速率来抽样,然后将幅度样本分层量化,并使用代码来表示。在接收端将收到的数字序列经过解码恢复到原模拟信号,保持原始语音的波形形状。话音质量高,编码速率高。如PCM编码类(a率或u率PCM、ADPCM 、ADM),编码速率为64-16kb/s,语音质量好。

参数编码

  根据语音信号产生的数学模型,通过对语音信号特征参数的提取后进行编码(将特征参数变换成数字代码进行传输)。在接收端将特征参数,结合数学模型,恢复语音,力图使重建语音保持尽可能高的可懂度,重建语音信号的波形同原始语音信号的波形可能会有相当大的区别。如线性预测(LPC)编码类。编码速率低,2.4-1.2kb/s,自然度低,对环境噪声敏感。

混合编码(Hybrid coding)

  将波形编码与参数编码相结合,在2.4-1.2kb/s速率上能够得到高质量的合成语音。混合编码包括若干语音特征参量又包括部分波形编码信息,以达到波形编码的高质量和参量编码的低速率的优点。

语音编码的极限速率

  语音中最基本的元素是音素,大约有128~256个,如果按通常的说话速度,每秒平均发出10个音素,则信息率为: I=[log2(256)10]bps=80bps
  把发音看成是以语音速率来传送,则语音编码的极限速率为80bps,从数字化标准的编码速率64kbps,到极限速率80bps,之间的距离,对于理论研究和实践有着极大的吸引力。

语音信号压缩编码的评价系统

  语音质量是衡量语音编码算法优劣的关键性能之一。语音质量通常分为四类:
  (1)广播级:宽带(0-7000Hz)高质量的语音,感觉不出噪声存在
  (2)网络或电话级:200Hz-3200Hz,信噪比大于30db。
  (3)通信级:完全可以听懂,但和长途电话相比,有明显失真。
  (4)合成级:80%-90%可懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征。
  语音质量有主观和客观两种评价方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值