宽带语音编码--机遇与实施挑战

转自:http://www1.ti.com.cn/customer/article/2004/09/0901_5.asp

 

引言

随着 IP 电话的广泛应用以及 3G 无线手持终端即将大量投产,通过"新型"分组电话网络提供优于普通长话音质的音频性能面临巨大机遇。我们可利用数据网络不受目前电话网络 8 KHZ 采样率(4 KHZ 通频带)限制的功能来实现优于普通长话音质的语音。我们提供低价的 DSP 进行宽带信号压缩,便于其在分组网络上传输,这也是目前上述功能成为现实的原因之一。

本文所讨论的课题就是宽带语音编码器及其实施所面临的挑战。我们将探讨标准化的宽带语音编码器,并讨论当前技术状态以及发展方向。此外,我们还将讨论系统影响以及广泛采用所面临的一些障碍。

宽带语音编码器

目前 IP 语音 (VoIP) 系统使用的大多数语音编码器都经过调整,可通过传统 PSTN 的带宽,因为与传统 PSTN 的互操作性一直是一个关键要求。由于 PSTN 使用 8 KHZ 的采样率,该带宽限制在大约 200-3400 HZ。宽带语音编码器将可用通频带扩展到 50-7000 HZ,针对的是不直接与传统数字 PSTN 进行互操作的应用。这就大大改善了语音交谈的音质,让我们能更清楚地听到通话,并更好地识别讲话者。此外,传输更高质量的音频信号(如音乐)也由此成为可能。

标准组织多年来一直在努力为上述应用定义宽带语音编码器标准。早期宽带编码器的主要用途是电视会议,不过近期工作则集中在 VoIP 与无线应用上。

以下部分将介绍宽带语音编码器的各种不同标准。

宽带语音编码--机遇与实施挑战

G.722 (SB-ADPCM)

ITU G.722 于 1988 年标准化,是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 16 KHZ 的频带分为两个子频带,并用 ADPCM 算法在子频带中进行编码。其总延迟约 3 ms,这已经很小,不致造成电信网络中的回声问题。此外,该编解码器传输位误差率仅为 10-3,其性能可以接受。即使遇到最差的网络传输条件,上述要求也可确保性能只是稍稍下降。

G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s。

G.722.1(转换 (Transform) 编码器)

ITU G.722.1 于 20 世纪 90 年代末开发,可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。该编解码器由 Picturetel 开发,使用了转换编码的方法。其在 16 KHZ 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 32 与 24 Kbits/s。目前大多用于电视会议系统。

G.722.2 (AMR-WB)

AMR-WB 是一种最初为 GSM 无线网络定义的宽带编解码器,但最近扩展为包括有线系统。由于其计算强度很大,因此要充分利用多年来显著提高的 DSP 处理能力。AMR-WB 建立在 CELP 语音编码器基础上,音频带宽为 50-7000 HZ,在 6.6 至 23.85 Kbit/s 间提供 9 种语音编码。

AMR-WB 于 2001 年标准化,用于 GSM 与 WCDMA 网络。2002 年底,ITU 决定它还将作为有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。

宽带语音编码--机遇与实施挑战

VMR-WB

VMR-WB 是新型可变速率多模式宽带语音编解码器,专为无线 CDMA 2000标准而设计,目的在于在 50 至 7000 HZ 的频带上进行语音编码,采样率为 16 KHZ。VMR-WB 基于 3GPP AMR-WB (G722.2) 编解码器,在每秒速率12.65 Kbit 上可实现互操作。

VMR-WB 工作模式有四种,具体选择哪种应视网络的流量情况而定。前三种模式专门针对 CDMA 系统,而第四种模式为 AMR-WB 互操作性模式。

VMR-WB 与 AMR-WB 的互操作性允许 GSM/WCDMA 与 CDMA2000 系统无须进行自动解码即可通信,这就不至于增加额外的延迟以及引起语音质量下降。

实施宽带编解码器的系统影响

电话系统设计有两个主要领域会因使用宽带编解码器而受影响:1) 模数输入/输出子系统,2) DSP 中进行的软件处理。

以下给出了 IP 电话的样例结构图,并在该图右下方显示了 DSP 处理器与A/D I/O 子系统之间的关系。

宽带语音编码--机遇与实施挑战

模数输入/输出子系统

A/D I/O 子系统包括扬声器、麦克风与硬件编解码器,对音频信号进行采样并将其数字化,以传输至 DSP。在能够进行宽带语音编码的电话中,重要的是让上述所有组件都支持 50-7000 Hz 的频带,这是宽带语音编码器的要求。

这意味着通常用于标准 PSTN 功能电话中的扬声器与麦克风将不再适用,从面将限制基于其设计的带宽。我们必须用具有宽带功能的扬声器与麦克风来替代它们。

此外,用于传统 PSTN 应用的标准硬件编解码器中的滤波器会带有防混淆滤波器,它将带宽限制在 200-3400 Hz。因此,设计具有宽带功能电话时的另一重要考虑因素就是使用支持 50-7000 Hz 带宽的硬件编解码器,并能以 16 Khz 进行信号采样。

软件

关于具有宽带功能电话软件的主要考虑因素之一是,要求串行输入端口与宽带语音编码器之间的处理组件必须运行于 16 KHz。该要求使单位时间必须处理的数据量翻番,通常也造成处理需求翻番。下页的结构图显示了从左侧 PCM 接口单元开始的受影响的组件。对处理要求影响最大的模块是回声抵消器,它的运行速率必须为传统 IP 电话的两倍,这影响相当大,因为回声抵消器占用大量的计算资源。

第二大受影响领域就是宽带语音编码器本身需要的处理要求。下页的表显示了AMR-WB 编解码器的处理要求相对于原先基于的 G.722 ADPCM 编码器增加了多少。AMR-WB 的 25 MIPS 要求相对于 12 MIPS 范围内的窄带 AMR 编解码器而言也是一个巨大的飞越。

语音处理--DSP 软件

Telogy Software®TMS320C55x™编解码器(宽带)模块

编解码器模块接口 C55xMIPS程序存储器C55x 存储器分配临时 (Scratch)
表 数据 Mem/ch
G.722Xdias5.611726340164438
G.722.1Xdias
AMR-WBXdias25.85224361307325374435

总结

本文介绍了在 VoIP 系统中实施宽带语音编解码器所面临的机遇与挑战。更强大的 DSP 可满足新型声音输入/输出设备的要求以及处理要求,这使用户能够通过宽带音频编码改善音质。

宽带语音编码--机遇与实施挑战

如欲了解更多有关 TI 处理上述挑战的信息,敬请访问网站:www.ti.com/voip

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值