音频调研之opus speex




音频编码调研

Opus

http://www.opus-codec.org/

Opus是一种混合式(hybrid)的编码器,有Skype的SILK和Xiph.org的CELT融合而成,于2012年9月,由Internet Engineering Task Force (IETF)标准化RFC 6716

Skype官方博客”Skype and a New Audio Codec”(2012年9月)提到“The innovation in Opus fuses SILK for voice with Xiph.Org’s CELT codec for music.”,并且提到Skype在Opus的标准化过程中做了很多的工作。

1、特点

主要

  • Bit-rates from 6 kb/s to 510 kb/s
  • Sampling rates from 8 kHz (narrowband) to 48 kHz (fullband)
  • Frame sizes from 2.5 ms to 60 ms
  • Support for both constant bit-rate (CBR) and variable bit-rate (VBR)
  • Dynamically adjustable bitrate, audio bandwidth, and frame size

次要

  • Audio bandwidth from narrowband to fullband
  • Support for speech and music
  • Support for mono and stereo
  • Good loss robustness and packet loss concealment (PLC)

2、性能

(1)编码器质量总结

(2)听力测试
Google测试1

测试形式:训练和未训练的17名测试者,主观打分;MUSHRA-type tests(MUltiple Stimuli with Hidden Reference and Anchor)

测试结果:http://www.opus-codec.org/comparison/GoogleTest1.pdf

测试结论总结:

  • 窄带单声道语音:Opus(11kbps)比iLBC(15kbps)和Speex(11kbps)好
  • 宽带单声道语音:Opus(20kbps)好于G.722.1(24kbps)、Speex WB(24kbps)
  • 全带单声道语音:Opus(32kbps)好于G.719(32kbps)
Google测试2

测试形式:

测试结果:http://www.opus-codec.org/comparison/GoogleTest2.pdf

测试结论总结:

  • 窄带单声道语音(普通话):Opus(11kbps)可以和iLBC(15kbps)相比,比Speex(11kbps)好
  • 宽带单声道语音(普通话):Opus(20kbps)好于G.722.1(24kbps)、Speex WB(24kbps)
  • 全带单声道语音(普通话):Opus(32kbps)好于G.719(32kbps)
(3)手动测试

Opus官网提供了可以在Windows下直接运行的编解码器,使用chn_man_woman.wav音频进行了测试,

测试音频:

chn_man_woman.wav,时长82s,44100Hz,32bit float,双声道

测试方法:

使用Opus提供的编码器将wav文件编码成.opus文件,在使用解码器将.opus解码成wav文件(44100Hz,16bit PCM,双声道)

测试结果如下:

编码比特率编码时间编码文件大小质量(主观)质量(客观)
32Kbps5s323KB几乎与原音频无差别尚无
20Kbps4s207KB几乎与原音频无差别尚无
15Kbps4s152KB音色稍有区别,声音清晰,无杂音尚无
10Kbps3s105KB声音明显模糊,声音分辨尚无
6Kbps2s76KB声音更加模糊,有轻微噪声,不影响分辨尚无

3、其他

Skype是否已经使用Opus?

Karlheinz Wurm, the audio and video product engineering director at Skype, said in a blog post (2012年9月)

<code class="hljs applescript has-numbering">Opus will make a quiet <span class="hljs-keyword">but</span> crystal clear entry <span class="hljs-keyword">into</span> <span class="hljs-keyword">the</span> world 
- most people will take <span class="hljs-keyword">for</span> granted <span class="hljs-keyword">the</span> high sound fidelity 
when <span class="hljs-keyword">it</span> arrives <span class="hljs-keyword">in</span> <span class="hljs-keyword">the</span> Skype client, <span class="hljs-keyword">through</span> browsers <span class="hljs-keyword">and</span> 
gateways, <span class="hljs-keyword">and</span> we hope <span class="hljs-function_start"><span class="hljs-keyword">on</span></span> mobile phones, game consoles <span class="hljs-keyword">and</span> 
conference rooms, too,</code><ul class="pre-numbering"><li>1</li><li>2</li><li>3</li><li>4</li><li>5</li></ul><div class="save_code tracking-ad" data-mod="popu_249"><a target=_blank href="javascript:;" target="_blank"><img src="http://static.blog.csdn.net/images/save_snippets.png" alt="" /></a></div>

SILK

https://developer.skype.com/silk

  • 该网址无法访问,考虑到Skype在中国的情况,不知是否需要翻墙。
  • 补充,翻墙访问该网址,会跳转到微软的网址,其中没有SILK的相关内容

根据Wikipedia SILK,SILK的最新版本是2012年发布的SDK 1.0.9,该版本可以独立于Skype下载使用,但不可用于商业应用。

1、特点

833b454a1b11bea3c1cba589962f3d39.media.600x256

2、性能

433a54dde8b060a525bf1e3112fbcad7.media.600x252

  • SILK的资料不多,上述均来源自SILKDataSheet.pdf

Speex

http://www.speex.org/

—The Speex codec has been obsoleted by Opus. It will continue to be available, but since Opus is better than Speex in all aspects, users are encouraged to switch—

1、特点

主要

  • 比特率2kbps到44kpbs
  • 窄带(8kHz)、宽带(16kHz)和超宽带(32kHz)三种采样率
  • 可变比特率编码

次要

  • Intensity stereo encoding
  • Packet loss concealment
  • Voice Activity Detection (VAD)
  • Discontinuous Transmission (DTX)
  • Fixed-point port
  • Acoustic echo canceller
  • Noise suppression

2、最新版本

Speex 1.2rc1,发布于2008年7月

3、性能

PESQ性能比较


CodecRate (kHz)bitrate (kbps)delay frame+lookahead (ms)multi-rateembeddedVBRPLCbit-robustlicense
Speex8 16 322.15-24.6 (NB) 4-44.2 (WB)20+10 (NB) 20+14 (WB)yesyesyesyes open-source/free software
iLBC815.2 or 13.320+5 or 30+10   yes no charge but not open-source
AMR-NB84.75-12.220+5?yes  yesyesproprietary
AMR-WB(G.722.2)166.6-23.8520+5?yes  yesyesproprietary
G.722.1 (Siren7)16(16) 24 3220+20yes  yesyesno charge but not open-source
G.7298810+5   yesyesproprietary
GSM-FR81320+?   ??patented?
GSM-EFR812.220+?   yesyesproprietary
G.723.185.3 6.337.5   yes?proprietary
G.7288160.625     

proprietary

G.7221648 56 64? yes  ??
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值