常用视频音频编码简介
这里只对常见的视频音频编码做一个系统的简单介绍,并不进行详细探讨。由于我的知识有限,难免有错误的地方,欢迎来信指正。
MPEG 系列
MPEG 即(Moving Pictures Experts Group) 运动图象专家组,属于ISO(International Organization for Standardization) 国际标准组织,他们开发了一系列视频音频编码,最为大家熟悉的就是 MP3,MPEG-1/2/4。
较早的视频编码,质量比较差,主要用于 CD-ROM 存储视频,国内最为大家熟悉的就是 VCD(Video CD),他的视频编码就是采用 MPEG-1。
在 MPEG-1 的基础上开发的一种视频编码,它的质量远远好于 MPEG-1,所以被运用在了 DVD-Video 上面,MPEG-2 是 DVD-Video 唯一指定的视频编码。MPEG-2 不光运用于 DVD-Video ,现在大部分 HDTV(高清电视)也采用 MPEG-2 编码,分辨率达到了 1920x1080。由于 MPEG-2 的普及,本来为 HDTV 准备的 MPEG-3 最终宣告放弃。
为了应对网络传输等环境,传统的 MPEG-1/2 已经不能适应,所以促使了 MPEG-4 的诞生。MPEG-4 采用了一系列新技术,来满足在低带宽下传输较高视频质量的需求。DivX,XviD,MS MPEG4 都是采用的 MPEG-4 视频编码,除了在 DVDRip 上面的应用,3GPP 现在也接纳了 MPEG-4 作为视频编码方案。
它和 MPEG-4 是两种不同的编码,主要是在极低码率下 MPEG-4 表现并不好,而 AVC 更加适合低带宽传输。在高码率上,AVC 的表现也要好过 MPEG-4,所以现在大有取代 MPEG-4 的趋势。下一代 HD DVD 和 Blue Ray Disc 已经正式接纳 AVC 为视频编码方案之一,相信 AVC 的发展前途会非常好。
也就是 MP1、MP2 ,较早的音频编码,是 MP3 的前身,主要用于 VCD,DVD,SVCD 的音频编码。
大名鼎鼎的 MP3,已经成为网络音频的主流格式,能在 128kbps 的码率接近 CD 音质。
在 MPEG-2 上开发的一种新的音频编码,和传统的 MPEG Audio 不兼容,它的质量理论上高于 MP3,并且支持多声道。在 96kbps 的码率范围内就能接近 CD 音质,比 MP3 更加适合地码率传输。
AAC 已经作为 MPEG-4 标准的音频编码,当然 MPEG-4 Audio 还有其他多种音频编码。
采用了 SBR 频带复制技术的 AAC,SBR 技术能够让音频编码降低一半的码率而音质不会有太大改变,已经成为 MPEG-4 标准的一部分。
NTT 开发的一种音频格式,曾经销声匿迹了一段时间,只在 Nero 里面见到过它的身影。现在搭上 SBR 技术又进入了 MPEG-4 标准,似乎不甘心就这么被遗忘,据说在低比特率下表现比 aacPlus 更好。
MP3 加上 SBR 技术诞生的一种产品,但是并没有得到多大推广,更没有进入标准。
让 MP3 插上多声道的翅膀,Fraunhofer 开发的又一种 MP3 升级产品,听说 DivX 6 准备将它作为音频编码。Fraunhofer 一直都在围绕着 MP3 升级,mp3PRO、MP3 Surround,这些产品都能和传统 MP3 兼容,但是随着层出不穷的新编码,不知道 MP3 还能走多远。
DVD系列
说了 MPEG ,就不能不提这个 MPEG-2 最大受益者——DVD。当然,这里是指 DVD-Video 和 DVD-Audio,也会涉及一些HD DVD。DVD 的编码都属于应用级的,它们自己并不开发编码,这一点要和 MPEG 区别开来。
DVD 事实上的音频编码标准,现在所有的 DVD 都采用它压缩音频,提供了最大 5.1 声道的输出支持,能在有限的空间存储高质的音频。
下一代 HD DVD 的音频编码,是 AC3 的升级版本,支持 7.1 甚至更多的声道,码率范围也有大幅提升。
HD DVD 上的无损音频编码,同样为 Dolby 公司开发,最高采样能达到 192KHz,也为 DVD-Audio 的音频编码标准。
DTS 最初是为电影院开发的音频系统,后来才应用于 DVD 中。它是 AC3 的有力竞争者,不过在 DVD 中只有 D9 才能够看到他的身影,虽然广大发烧友都在鼓吹它的效果超过 AC3,但是测试出来并不如想象中的那么好,特别是高频方面不及 AC3。
下一代 HD DVD 的音频编码,它和 Dolby Digital Plus 都被指定为强制编码,看来在未来会和 Dolby 平分秋色。
没有压缩的 PCM 编码,只能存储两声道,但是采样率能够高达 96KHz,是 DVD-Video 中音质最好的一种,当然体积也是最大的。
主要是 MP2,应用于 PAL 制式的 DVD,压缩率高,支持多声道(MPEG-2 规范都支持多声道)。
这个似乎扯远了,不过作为 DVD-Audio 的最大竞争对手 SACD,顺带介绍一下。DSD(Direct Stream Digital)直接比特流数字,由 Sony 推出,能够避免传统 PCM 编码的弊端,达到非常高的品质。最高采样和 DVD-Audio 一样,192KHz。
H.26X系列
“ITU(International Telecommunication Union)国际电传视讯联盟”主导的编码系列,主要应用于实时视频通信领域,如会议电视等。由于现在 MPEG 系列也开始向这个领域进军,所以这两个组织也开始了密切的合作,如最近热门的 AVC/H.264,就是由 ITU 旗下的“VCEG(Video Coding Experts Group)视频编码专家组”和“ISO(International Organization for Standardization)国际标准组织”旗下的“MPEG (Moving Pictures Experts Group)运动图象专家组”联合制作发布的。
H.261是ITU-T为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的,它是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包括运动补偿的帧间预测、DCT变换、量化、熵编码,以及与固定速率的信道相适配的速率控制等部分。
H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准,它是在H.261基础上发展起来的。
H.263 的第二个版本,加入了许多新技术来扩展 H.263 的应用范围。
在 H.263+ 上增加了几个选项,来增强码流在恶劣信道上的抗误码性能,同时提高增强编码效率。
也就是前面提到的 MPEG-4 AVC。H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。在ISO/IEC中该标准命名为AVC (Advanced Video Coding),作为MPEG-4标准的第10个选项;在ITU-T中正式命名为H.264标准。
3GPP
现在通讯领域最热门的话题之一,既然说了 MPEG 和 ITU,和这两个千丝万缕的 3GPP 应用就不得不提了。3GPP 的视频采用了 MPEG-4 和 H.263 两种编码,可能还将加入 H.264,音频方面音乐压缩采用 AAC,语音则采用先进的 AMR,另一个 aacPlus 随着 V2 版本的推出,底码率下的效果更加突出,也有望加入标准。
Windows Media系列
Microsoft 公司主导的音频视频编码系列,它的出现主要是为了进行网络视频传输,现在已经向 HDTV 方面进军,开发了 WMV HD 应用。
- Microsoft MPEG-4 v1/v2/v3
最早的 ASF 采用的视频编码,基于 MPEG-4 技术开发,DivX3.11 就是基于 Microsoft MPEG-4 v3 破解出来的,后来才进行了重写。
Microsoft 正式开发的第一个 Windows Media Video,开始脱离了 MPEG-4,和 MPEG-4 不兼容,从这一点上可见微软的野心。可惜这个版本压缩效果非常烂,打破了微软一飞冲天的美梦,不过它在压缩速度上非常快,现在网络上有很多采用这种格式压缩的 WMV。
在 WMV7 基础上改进的版本,质量上面进不了不少。
微软的重头戏,不光是这一个编码,V9 系列更是一个平台,让微软有足够的能力挑战 MPEG,ITU 等标准化组织。虽然这个版本并没有微软吹得那么厉害,特别是低码率下比较差,不过跟以前版本相比进步还是非常多的。特别是 WMV HD 的应用,让微软也跻身视频标准领域。
- Windows Media Video 9 Professional
WMV HD 应用的编码,和 WMV9 兼容,在高比特率上进行了优化,画面非常优秀。(不过几十M的码率能不优秀吗?全是体积换来的。)
- Windows Media Video 9 Advanced Profile
随着 Windows Media Player 10 推出的编码器,能够更进一步控制 WMV9 的质量。但是不能在老版本的 WMP9 上播放,也就是不兼容老版本的 WMP9,真不知微软在搞什么?
- Windows Media Video 9 Screen
静态屏幕无损压缩编码,质量非常好,压缩率高,只针对如屏幕等变化非常小的环境。
- Windows Media Video 9 Image
静态图像压缩编码。
- Windows Media Audio v1/v2
微软最早的音频编码技术,用于 ASF 中,后来被破解也用在 DivX Audio 中,质量比较差。
- Windows Media Audio 7/8/9
随着各种不同的 WMV 而推出的相应的音频编码,质量节节提升,不过还没有达到 64kbps CD音质的神化。
- Windows Media Audio 9 Professional
WMA9 中出现的新编码,主要用于多声道编码和高采样率音频的编码,质量不错。
- Windows Media Audio 9 Voice
针对语音的编码,最高 20kbps ,不过和 AMR 相比,效果就太差了。
- Windows Media Audio 9 Lossless
无损音频编码,可以完美保留CD原质量,是CD备份的不错选择,不过代价是体积过大。
RealMedia系列
RealNetworks 所开发的系列编码技术,也是主要用于网络传输,在底码率下表现不错。
早期的 RealVideo 编码,质量比较糟糕,不过那时在网络上算是很先进了,毕竟当时能用网络看视频的人不多。
随着 RealPlayer 8 推出的视频格式,是现在主流的网络视频编码之一。编码速度较慢,质量也只能算一般。
RealNetworks 开发的新一代编码,质量进步了很多,特别是在底码率下,而且编码速度很快,做到了速与质的很好统一。
在 RealVideo 9 基础上加入了一些参数,如 EHQ 等,更加精确控制码率,和 RealVideo 9 兼容。
早期的音频编码,但是在现在看来,仍然质量不错,可惜最高码率 96kbps。应用到了两代音频编码中:RealAudio G2、RealAudio 8。
- RealAudio Cook Multichannel
Cook 的改进版本,增加了5.1声道的支持,应用到了 RealAudio 10 Multichannel 中。
采用了 Sipro 语音编码技术,主要针对语音编码,应用在更早期的 RealAudio 4.0、RealAudio 5.0 中。
Sony 公司开发的 ATRAC3 编码,被 RealNetworks 公司购买过来应用到了 RealAudio 8 中,以弥补 Cook 高码率上的不足。
AAC 音频编码,用于 RealAudio 10 中。
aacPlus 音频编码,用于 RealAudio 10 中,不过并没有随 RealProducer 发行,需要单独购买。
无损音频编码。
QuickTime系列
QuickTime 并不是一个编码,而是一个多媒体平台,它的上面有众多编码,这里只介绍几个主流的编码器。
Sorenson Media 公司开发的编码器,主要用于 QuickTime 4 的视频编码,质量较差。
Sorenson Media 公司随 QuickTime 5 发布的编码器,质量很不错,已经成为 QuickTime 的标准视频编码,网络上大部分电影预告片都采用这种编码。
Apple 公司自己开发的 MPEG-4 编码器,随 QuickTime 6 发布,质量很差。
Apple 公司自己开发的 H.264 编码器,随 QuickTime 7 发布,支持 HDTV。