音视频技术总结

第一部分:基本概念讲解

媒体: 是表示,传输,存储信息的载体,常人们见到的文字、声音、图像、图形等都是表示信息的媒体。

多媒体是: 是声音、动画、文字、图像和录像等各种媒体的组合,以图文并茂,生动活泼的动态形式表现出来,给人以很强的视觉冲击力,留下深刻印象

多媒体技术 :是将文字、声音、图形、静态图像、动态图像与计算集成在一起的技术。它要解决的问题是计算机进一步帮助人类按最自然的和最习惯的方式接受和处理信息。

流媒体 流媒体是指采用流式传输的方式在 Internet 播放的连续时基媒体格式 ,实际指的是一种新的媒体传送方式,而不是一种新的媒体格式(在网络上传输音 / 视频等多媒体信息现在主要有下载和流式传输两种方式) 流式传输分两种方法:实时流式传输方式(Realtime streaming) 和顺序流式传输方式(progressive streaming)

多媒体文件 是既包括视频又包括音频,甚至还带有脚本的一个集合,也可以叫容器;

媒体编码: 是文件当中的视频和音频所采用的压缩算法。也就是说一个 avi 的文件,当中的视频编码有可能是 A ,也可能是 B ,而其音频编码有可能是 1 ,也有可能是 2   

转码 :指将一段多媒体包括音频、视频或者其他的内容从一种编码格式转换成为另外一种编码格式

视频: 连续的图象变化每秒超过 24 帧( Frame )画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频

音频 : 人类能听到的声音都成为音频,但是一般我们所说到的音频时存储在计算机里的声音

 

 

第二部分:视频文件格式

基本视频概念讲解:

码率:


码率就是数据传输时单位时间传送的数据位数
,
一般我们用的单位是
kbps,
即千位每秒。 通俗一点的理解就是取样率,
单位时间内取样率越大,精度就越高,处理出来的文件就越接近原始文件,但是文件体积与取样率是成正比的,所以几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真。但是因为编码算法不一样,所以也不能用码率来统一衡量音质或者
画质
画质


帧:


帧就是一段数据的组合,它是数据传输的基本单位。
就是影像动画中最小单位的单幅影像画面,相当于电影胶片上的每
一格镜头。 一帧就是一副静止的画面,连续的帧就形成动画,如电视图像等。


帧率:


帧率即每秒显示帧数,帧率表示图形处理器处理场时每秒钟能够更新的次数。高的帧率可以得到更流畅、更逼真的动画。
一般来说
30fps
就是可以接受的,但是将性能提升至
60fps
则可以明显提升交互感和逼真感,但是一般来说超过
75fps一般就不
容易察觉到有明显的流畅度提升了。如果帧率超过屏幕刷新率只会浪费图形处理的能力,因为监视器不能以这么快的速度更新

,这样超过新率的帧率就浪费掉了。



关键帧:


相当于二维动画中的原画,指角色或者物体运动或变化中的关键动作所处的那一帧,它包含了图像的所有信息,后来
帧仅包含了改变了的信息。

如果你没有足够的关键帧,你的影片品质可能比较差,因为所有的帧从别的帧处产生。对于一般的
用途,一个比较好的原则是每
秒设一个关键键。但如果时那种实时传输的流文件,那么要考虑传输网络的可靠度,所以要
1
到2
秒增加一个关键帧。


目前我们经常见的视频格式无非就是两大类:
1、影像格式(Video
2、流媒体格式(Stream Video

在影像格式中还可以根据出处划分为三大种:
1、AVI 格式:这是由微软(Microsoft )提出,具有 悠久历史 的一种视频格式
2、MOV 格式:这是由苹果(Apple )公司提出的一种视频格式
3、MPEG/MPG/DAT :这是由国际标准化组织ISO(International Standards Organization)IEC(International Electronic Committee) 联合开发的一种编码视频格式。MPEG 是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台共同支持。

在流媒体格式中同样还可以划分为三种:
1、RM 格式:这是由Real Networks 公司开发的一种新型流式视频文件格式。
2、MOV /QT 格式:MOV 也可以作为一种流文件格式。QuickTime 能够通过Internet 提供实时的数字化信息流、工作流与文件回放功能,为了适应这一网络多媒体应用,QuickTime 为多种流行的浏览器软件提供了相应的QuickTime Viewer 插件(Plugin ),能够在浏览器中实现多媒体数据的实时回放。
3 ASF 格式:这是由微软公司开发的流媒体格式,是一个在 Internet 上实时传播多媒体的技术标准。

4. FLV



具体视频文件格式详解:

*. MPEG/.MPG/.DAT
MPEG也是 Motion Picture Experts Group 的缩写。这类格式包括了 MPEG-1, MPEG-2 MPEG-4 在内的多种视频格式。 MPEG-1 相信是大家接触得最多的了,因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的 ( 刻录软件自动将 MPEG1 转为 .DAT 格式 ) ,使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小。 MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV (高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用 MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小( MPEG2 的图像质量 MPEG-1 与其无法比拟的)。

*.AVI
  它的英文全称为 Audio Video Interleaved ,即音频视频交错格式。是将语音和影像同步组合在一起的文件格式。它对视频文件采用了一种有损压缩方式,但压缩比较高,因此尽管面面质量不是太好,但其应用范围仍然非常广泛。 AVI 支持 256 色和 RLE 压缩。 AVI 信息主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。它于 1992 年被 Microsoft 公司推出,随 Windows3.1 一起被人们所认识和熟知。所谓 音频视频交错 ,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本 Windows 媒体播放器播放不了采用早期编码编辑的 AVI 格式视频,而低版本 Windows 媒体播放器又播放不了采用最新编码编辑的 AVI 格式视频,所以我们在进行一些 AVI 格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行 AVI 格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。是目前视频文件的主流。 这种格式的文件随处可见,比如一些游戏、教育软件的片头,多媒体光盘中,都会有不少的 AVI 。现在,在 WINDOWS 95 98 里都能直接播放 AVI ,同一种格式的 avi 文件有可能采用不同的编码方式,最常见的有 Intel Indeo R Video R3.2 (像游戏过场动画等,是目前使用最广泛的一种 avi 编码技术)、 Microsoft video 等。

*.RA/RM/RAM
  *.RM Real Networks 公司所制定的音频 / 视频压缩规范 Real Media 中的一种, Real Player 能做的就是利用 Internet 资源对这些符合 Real Media 技术规范的音频 / 视频进行实况转播。在 Real Media 规范中主要包括三类文件: RealAudio Real Video Real Flash Real Networks 公司与 Macromedia 公司合作推出的新一代高压缩比动画格式)。 REAL VIDEO RA RAM )格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者。它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放, RealVideo 的定位来看,就是牺牲画面质量来换取可连续观看性。其实 RealVideo 也可以实现不错的画面质量,由于 RealVideo 可以拥有非常高的压缩效率,很多人把 VCD 编码成 RealVideo 格式的,这样一来,一张光盘上可以存放好几部电影。 REAL VIDEO 存在颜色还原不准确的问题, RealVideo 就不太适合专业的场合,但 RealVideo 出色的压缩效率和支持流式播放的特征,使得 RealVideo 在网络和娱乐场合占有不错的市场份额。

*.MOV
MOV
格式,美国 Apple 公司开发的一种视频格式,默认的播放器是苹果的 QuickTimePlayer 。具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,即不仅能支持 MacOS ,同样也能支持 Windows 系列 , 在所有视频格式当中,也许 MOV 格式是最不知名的。也许你会听说过 QuickTime MOV 格式的文件正是由它来播放的。在 PC 几乎一统天下的今天,从 Apple 移植过来的 MOV 格式自然是受到排挤的。它具有跨平台、存储空间要求小的技术特点,而采用了有损压缩方式的 MOV 格式文件,画面效果较 AVI 格式要稍微好一些。到目前为止,它共有 4 个版本,其中以 4.0 版本的压缩率最好。这种编码支持 16 位图像深度的帧内压缩和帧间压缩,帧率每秒 10 帧以上。现在这种格式有些非编软件也可以对它时行处理,其中包括 ADOBE 公司的专业级多媒体视频处理软件 AFTEREFFECT PREMIERE

*.ASF
  ASF (Advanced Streaming format 高级流格式 ) ASF MICROSOFT 为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。 ASF 使用了 MPEG4 的压缩算法,压缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频 格式存在的,所以它的图像质量比 VCD 差一点点并不出奇,但比同是视频 格式的 RAM 格式要好。 ASF 支持任意的压缩 / 解压缩编码方式,并可以使用任何一种底层网络传输协议,具有很大的灵活性。 ASF 流文件的数据速率可以在 28.8Kbps 3Mbps 之间变化。用户可以根据自己应用环境和网络条件选择一个合适的速率,实现 VOD 点播和直播。

*.WMV
  WMV 是微软推出的一种流媒体格式,它是 ASF 的升级延伸,在同等视频质量下, WMV 格式的体积非常小,因此很适合在网上播放和传输。微软希望用其取代QuickTime 之类的技术标准以及 WAV AVI 之类的文件扩展名。 WMV 的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

*. NAVI
 如果你发现原来的播放软件突然打不开此类格式的 AVI 文件,那你就要考虑是不是碰到了 n AVI n AVI New AVI 的缩写,是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由 Microsoft ASF 压缩算法的修改而来的(并不是想象中的 AVI ),视频格式追求的无非是压缩率和图像质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率。可以这样说, NAVI 是一种去掉视频流特性的改良型 ASF 格式。

*.FLV

FLV FLASH VIDEO 的简称, 是由 Macromedia 公司开发的属于自己的流式视频格式。 FLV 也就是随着 Flash MX 的推出发展而来的视频格式,是在 sorenson 公司的压缩算法的基础上开发出来的。 FLV 格式不仅可以轻松的导入 Flash 中,速度极快,并且能其到保护版权的作用,并且可以不通过本地的微软或者 REAL 播放器播放视频。 Flash MX 2004 对其提供了完美的支持,它的出现有效地解决了视频文件导入 Flash 后,使导出的 SWF 文件体积庞大,不能在网络上很好的使用等缺点。由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入 Flash 后,使导出的 SWF 文件体积庞大,不能在网络上很好的使用等缺点。


视频文件转换:

比较常见的视频格式转化有:

RM ASF

AVI RMVB

dat-->divx

mpg-->divx

vcd-->rm

dat-->rm

mpg,dat avi mov-->rm

*-->FLV

最近视频博客的兴起,导致了 flv 的快速发展


AVI
MPEG(MPEG 1)
     
例如有纪念性的家庭录影带,可以事先转换成 AVI 格式,再用软件将它转换成 MPEG 1 格式,然后用刻录器将 MPEG 1 格式文件刻录光盘片,得到的就是普通的 VCD 光盘了,可以拿到任何 VCD 播放器上播放。  

MPEG(MPEG
1) AVI
     
   MPEG AVI 文件之间的转换,为磁盘节省空间。

MPEG(MPEG
1) ASF
       vcd 文件转码后实现 VOD 点播和直播。


ASF
MPEG(MPEG 1)
      
由于 ASF 视频格式的先天限制,一般来说它的图像质量往往比不上 MPEG 1 ,所以转换之前,请三思而后行。
        
DVD(MPEG
2) VCD (MPEG 1)
      
由于 DVD 驱动器尚未普及以及 DVD 光盘成本昂贵等客观原因, DVD 影片一直未能像 VCD 一样流行。但我们可以将喜爱的 DVD 影片转换成 MPEG 1 格式的视频文件,留在硬盘上观看或是刻成 VCD 光盘。

dat/mpg->mp3

CD-->wav,mp3,wma

rm-->mp3

mp3-->wma
        

以上列举的视频格式转化都是比较常见的,当然了,说到底,是有这方面的实际应用需求才会出现这方面的视频转化需要。
比如说,要把一部 VCD (也就是 MPEG1 编码的视频文件)制作成可以在线观看的影片,最大的瓶颈就在于文件尺寸的改变,并且要能够适应网络的特点,这样原始的格式就不能满足需    要,必须要转化成互联网视频播放规范的流媒体格式才可以,比如说是 RM 或者 ASF ,这就是需要,所以针对影像格式转化为流媒体格式的软件也就应用而生了,还有现在非常流行的 MPEG4 视频压缩技术,它能够把一张 DVD 压缩到一张 CD 上去,并且视频效果也不会有太大的变化,至少在我们普通用户看来也是非常不错的,而文件体积则大大减小了,这就要求有能够把 DVD 转化成 MPEG4 文件的软件出现,但是如果有人想要把 RM 转化成 MPEG1 VCD ),就没有太大的实际意义了,因为这样并不能给视频效果带来太大的提升,反而文件尺寸大了许多,所以我们很少能够看到这样的转化软件,其他的也类似,所以,在视频转化领域,可以参照以下两个原则:
1 有明确的应用方向:就是说一种视频格式转化成另一种视频格式,必须要有明确的应用方向,即目标格式能够有很广泛的应用价值,而不是说为了转化而转化,比如上文所说的 VCD->RM ,它的应用方向就是网络播放,因为现在在线电影是一个很大的市场和网络的应用方向。
2 能够提升播放价值: 就是说一种视频格式转化成另一种视频格式除了有明确的应用方向外,还要考虑转化是不是有价值,如果说转化后的文件播放效果没有明显提升,但是文件尺寸却大了一倍,我想这样亏本的买卖是没有人会去做的, RM 转化成 VCD 就没有实际的意义,原因如前文所述,而 DVD 转化成 MPEG4 价值就很大,不说转化后的播放效果,单说成本就降低了不少。

 

音视频压缩编码标准:

多媒体编辑码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式,现在主要的编码方式有:

1.   MPEG 系列: 视频编码方面主要是 Mpeg1 Mpeg2 Mpeg4 Mpeg4 AVC
音频编码方面主要是 MPEG Audio Layer 1/2 MPEG Audio Layer 3 MPEG-2 AAC MPEG-4 AAC 等等。 注意: DVD 音频没有采用 Mpeg
2. H.26X
系列: 包括H261H262H263H263+H263++H264

2.   微软windows media 系列: 视频编码有Mpeg-4 v1/v2/v3Windows Media Video 7/8/9/10 音频编码有Windows Media audeo v1/v2/7/8/9

3.   Real Media 系列: 视频编码有RealVideo G2RealVideo 8/9/10 音频编码有RealAudio cook/siproRealAudio AAC/AACPlus

4.   QuickTime 系列: 视频编码有Sorenson Video 3Apple MPEG-4Apple H.264 音频编码有QDesign Music 2Apple MPEG-4 AAC

5.   其它,如:OggOn2-vpxflash vidio ,以及 M-JPEG 视频压缩方式

 

各视频编码的应用场合简要: http://blog.csdn.net/luchy/archive/2007/03/27/1542478.aspx 这里讲的挺详细的

1.    Mpeg1 较早的视频编码,质量比较差,主要用于  CD-ROM  存储视频,国内最为大家熟悉的就是  VCD Video CD ),他的视频编码就是采用  MPEG-1

2.     MPEG-1  的基础上开发的一种视频编码,它的质量远远好于  MPEG-1 ,所以被运用在了  DVD-Video  上面, MPEG-2   DVD-Video  唯一指定的视频编码。 MPEG-2  不光运用于  DVD-Video  ,现在大部分  HDTV (高清电视)也采用  MPEG-2  编码,分辨率达到了  1920x1080

3.    MPEG-3 MPEG 组织制定的视频和音频压缩标准。本来的目标是为 HDTV 提供 20-40Mbps 视频压缩技术。在标准制定的过程中,委员会很快发现 MPEG-2 可以取得类似的效果。随后, MPEG-3 项目停止了。

4.    MPEG-4 是为了适应网络的需求,采用一系列新技术,以最少的数据获得最佳的图像质量为目标的新一代编码方式。主要应用在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、 Internet intranet 上的视频流与可视游戏、 DVD 上的交互多媒体应用等方面。 Divx xvid ms mpeg4 都是采用 mpeg-4 视频编码的。对于普通用户来说, MPEG-4 在目前来说最有吸引力的地方还在于它能在普通 CD-ROM 上基本实现 DVD 的质量;用 MPEG-4 压缩算法的 ASF(Advanced Streaming format ,高级格式流 ) 可以将 120 分钟的电影压缩为 300MB 左右的视频流;采用 MPEG-4 压缩算法的 DIVX 视频编码技术可以将 120 分钟的电影压缩 600MB 左右

5.    Mpeg4 AVC  MPEG-4  是两种不同的编码,主要是在极低码率下  MPEG-4  表现并不好,而  AVC  更加适合低带宽传输。在高码率上, AVC  的表现也要好过  MPEG-4 ,所以现在大有取代  MPEG-4  的趋势。 下一代 HD DVD  Blue Ray Disc  已经正式接纳 AVC  为视频编码方案之一,相信 AVC  的发展前途会非常好。AVC/H.264 极有可能成为下一代视频格式,( avs ,中国标准)

6.    H.261 ITU-T 为在综合业务数字网 (ISDN) 上开展双向声像业务 ( 可视电话、视频会议 ) 而制定的,它是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包括运动补偿的帧间预测、 DCT 变换、量化、熵编码,以及与固定速率的信道相适配的速率控制等部分。

7.    H.262 是由 ITU-T VCEG 组织和 ISO/IEC MPEG 组织联合制定的,所以制定完成后分别成为了两个组织的标准,正式名称是 "ITU-T 建议 H.262" "ISO/IEC 13818-2" 。这两个标准在所有的文字叙述上都是相同的。

8.    H.263 ITU-T 为低于 64kb/s 的窄带通信信道制定的视频编码标准,它是在 H.261 基础上发展起来的

9.    H263+ H.263  的第二个版本,加入了许多新技术来扩展  H.263  的应用范围。

10. H.263++ 是在 H.263+  上增加了几个选项,来增强码流在恶劣信道上的抗误码性能,同时提高增强编码效率。

11. H.264 也就是前面提到的  MPEG-4 AVC H.264 是由 ISO/IEC ITU-T 组成的联合视频组 (JVT) 制定的新一代视频压缩编码标准。在 ISO/IEC 中该标准命名为 AVC (Advanced Video Coding) ,作为 MPEG-4 标准的第 10 个选项;在 ITU-T 中正式命名为 H.264 标准。

12. Microsoft MPEG-4 v1/v2/v3 最早的 ASF  采用的视频编码,基于 MPEG-4  技术开发,DivX3.11  就是基于 Microsoft MPEG-4 v3  破解出来的,后来才进行了重写。

13. Windows Media Video 7 Microsoft  正式开发的第一个 Windows Media Video ,开始脱离了 MPEG-4 ,和 MPEG-4  不兼容,从这一点上可见微软的野心。可惜这个版本压缩效果非常烂,打破了微软一飞冲天的美梦,不过它在压缩速度上非常快,现在网络上有很多采用这种格式压缩的 WMV

14. Windows Media Video 8  WMV7  基础上改进的版本,质量上面进不了不少

15. Windows Media Video 9 ,微软的重头戏,不光是这一个编码,V9  系列更是一个平台,让微软有足够的能力挑战  MPEG ITU  等标准化组织。虽然这个版本并没有微软吹得那么厉害,特别是低码率下比较差,不过跟以前版本相比进步还是非常多的。特别是  WMV HD  的应用,让微软也跻身视频标准领域。

16. RealVideo G2 早期的  RealVideo  编码,质量比较糟糕,不过那时在网络上算是很先进了,毕竟当时能用网络看视频的人不多。

17. RealVideo 8 随着  RealPlayer 8  推出的视频格式,是现在主流的网络视频编码之一。编码速度较慢,质量也只能算一般。

18. RealVideo 9 RealNetworks  开发的新一代编码,质量进步了很多,特别是在底码率下,而且编码速度很快,做到了速与质的很好统一。

19.RealVideo 10  RealVideo 9  基础上加入了一些参数,如 EHQ  等,更加精确控制码率,和 RealVideo 9  兼容。

20.Sorenson Video 3Sorenson Media  公司随 QuickTime 5  发布的编码器,质量很不错,已经成为 QuickTime  的标准视频编码,网络上大部分电影预告片都采用这种编码。

21.Apple MPEG-4Apple  公司自己开发的 MPEG-4  编码器,随 QuickTime 6  发布,质量很差。

22.Apple H.264Apple  公司自己开发的 H.264  编码器,随 QuickTime 7  发布,支持 HDTV

23. Ogg   Xiph.org  基金会发起的一个开放源代码项目,包括视频音频,服务器,传输系统,客户端,硬件支持等,最为大家熟悉的就是音频  Ogg Vorbis ,它被认为是迄今为止  128kbps  码率上最好的编码器。

24. On2 VPX 系列 On2  公司开发了一系列优秀的视频编码,现在应用得最多的恐怕是  Nullsoft Video  的视频,它们就采用了  VP3 VP5 VP6  视频编码。

25. Flash Video Macromedia  公司推出的多媒体格式,主要用于在 Flash  中压缩视频。视频采用 Sorenson  公司的 Spark  编码器,音频采用 MP3 ,质量比较差。传闻下一代 Flash Video  准备使用 On2 VP6  ,那将让视频质量得到一个量的提升。

26.M-JPEG Motion-JoinPhotographicExpertsGroup )技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外 M-JPEG 的压缩和解压缩是对称的,可由相同的硬件和软件实现。

 

各音频编码的应用场合简要:

1.     MPEG Audio Layer 1 典型数据压缩率是 1 4 即每个立体声信号为384 kbps

2.     MPEG Audio Layer 2 典型数据压缩率是 1 4---1 8 即每个立体声信号为256192 kbps MPEG Audio Layer1/2 主要用于 vcd svcd 的音频编码

3.     MPEG Audio Layer 3 ,也就是大名鼎鼎的 mp3 ,已经成为网络音频的主流格式,能在 128kbps 的码率下接近 cd 音质。典型数据压缩率是 1 10---1 12 即每个立体声信号为 128 112 kbps

4.     MPEG-2 AACAdvanced Audio Coding )是在1997 年由以BosiBrandenburgJohnston 等为首的音频编码研究提出的,它总结了MPEG-1MPEG-2AC-3 等的长处,在MPEG 系统上进一步改进了很多新的功能,大大增强了编码的灵活度,在保证音质的同时更大限度地压缩了码率。它和传统的 mpeg audio 不兼容,在理论上质量要高于 mp3 ,并且支持多声道,在 96kbps 的码率范围内能接近 cd 音质,比 mp3 更加适合低码率传输;同时, MPEG-2 AAC 已经成为 MPEG-4 标准中高质量音频编码的核心,是下一代音频压缩标准。

5.     MPEG-4 AAC :是 MPEG-4 标准音频编码标准的一部分, apple 公司自己开发有这种  AAC  编码器,质量非常好,是最优秀的  AAC  编码器之一,随  QuickTime 6  发布

6.     杜比数字 AC-3 技术也就是 5.1 声道技术

7.     Windows Media Audio v1/v2 微软最早的音频编码技术,用于 ASF  中,后来被破解也用在 DivX Audio  中,质量比较差。

8.     Windows Media Audio 7/8/9 随着各种不同的  WMV  而推出的相应的音频编码,质量节节提升,不过还没有达到  64kbps CD 音质的神化

9.     Windows Media Audio 9 Professional WMA9  中出现的新编码,主要用于多声道编码和高采样率音频的编码,质量不错。

10.  RealAudio Cook 早期的音频编码,但是在现在看来,仍然质量不错,可惜最高码率 96kbps 。应用到了两代音频编码中:RealAudio G2RealAudio 8

11.  RealAudio Sipro 采用了 Sipro  语音编码技术,主要针对语音编码,应用在更早期的 RealAudio 4.0RealAudio 5.0  中。

12.  RealAudio AAC AAC  音频编码,用于 RealAudio 10  中。

13.  RealAudio aacPlus aacPlus  音频编码,用于 RealAudio 10  中,不过并没有随 RealProducer  发行,需要单独购买。

14.  QDesign Music 2 QDesign Music  的第二个版本,也是最后一个版本,在时下这些先进的音频编码面前,它已经没有生命力了,主要应用于网上的电影预告片。

15.  Apple MPEG-4 AAC Apple  公司自己开发的 AAC  编码器,质量非常好,是最优秀的 AAC  编码器之一,随 QuickTime 6  发布。

 

 

 

四种主流的视频压缩编码标准:

1 Windows Media Video 9

  相比起其他三种图像压缩技术, WMV 可能是使用率最高的视频编码格式。原因十分简单,如果想使自己的影片直接给网上其他用户观看到的话,利用微软自身的视频编码标准是最简单的做法。因为只要用户的电脑中有 Windows Media Player( 媒体播放器 ) ,就能够播放 WMV 影片,而且不用额外安装 Codec (编码),所以兼容性方面完全不用担心。借助 Windows Media 9.0 Series 的新技术, Windows Media Video 9.0 比旧的 8.0 版有多达 15-50% 的压缩率提高。而且与 MPEG-4 画质相比时,其容量大小只需一半即可达到。加上配合 Windows Media Service 9.0 服务器,在 Streaming media (流媒体)方面也有更佳的表现。  

官方网站: http://www.microsoft.com

2 Real Video 9

玩电脑时间长的朋友都知道, Real Video 是多年前市场上最普及的音乐、图像格式。不过随着 MP3 WMV WMV 等的兴起,已经使 Real Media 格式的普及率大不如前。但现在全世界仍然有许多的电脑玩家是Real Video 的支持者,网上供下载的影片很多也是 RM RMVB 格式。  RealNetwork 新推出了一套名为 Helix Producer 的工具(也就是 Real Producer 9 ),其中的 RealVideo 9 在图像压缩编码技术方面作出重大优化,无论在下载或 Streaming 时都声称比 Windows Media 9 出色,能够以一半的比特速率( bitrate )达到 MPEG-4 级图像,在约 500 Kbps 时达到接近 DVD 的画质表现。同样地,配合服务器可获得更出色的效果。

官方网址: http://www.realnetworks.com

 

3 DivX

  历史介绍:

ISO 公布了“超低比特率活动图像和语音压缩标准 ”,排序 MPEG 4,1998 10 月批准第一版, 1994 4 月又公布了第二版及其校验模型( VM ), MPEG 4 正式编号是 ISO/IEC 国际标准 14496 ,它是一种新型的多媒体标准,它与前标准一个重要区别就在于,是一个基于对象的视编码压缩标准,所定义的码率控制的目标就是获得在给定码率下的最优质量,它为互联网上传输高质量的多媒体视频提供了很好的技术平台。

1998 年微软开发了第一个在 PC 上使用的 MPEG 4 编码器,它包括 MS MPEG4V1 MS MPEG4V2 MS MPEG4V3 的系列编码内码,其中 V1 V2 用来制作 AVI 文件,一直到现在它都是作为 Windows 的默认组件,不过 V1 V2 的编码质量不是很好,一直到 MS   MPEG4V3 才开始有好转,画质有了显著的进步,但是不知微软出于什么目的,却将这个 MS   MPEGV3 的视频编码内核封闭,仅仅使其应用于 Windows Media 流媒体技术上,也就是我们熟悉的 ASF 流媒体文件中。 ASF 文件虽然有一些优势,但是由于过分的封闭不能被编辑,末得到广泛应用,这便惹怒了那些个不怕天不怕地的视频黑客和致力于钻研视频编码的高手,后来,这些小组不仅破解了微软的视频编码,而且经过他们的修改,一种新的视频编码诞生了:那就是广为流传的 MPEG 编码器- DivX3.11

DivX 采用了 MS MPEGV3 ,改良后并加入自己功能称之为 DivX3.11 ,也是目前互联网上普通采用的 MPEG 4 编码器之一。很快, DivX 被传得红得发紫,几乎成了业界的标准,但是,同样很快地出现了, DivX 的基础技术是非法盗用微软的,微软声称将对所有推动 DivX 发展的人、企业进行追究,可是 DivX 技术的创造者之一罗达( Rota )正全面申请将 DivX 合法化,这是基于 DivX 虽然是从 Window 的发明出来的,但却没有用过任何微软的技术,更组建新公司 DivXNetworks 全力推广 DivX ,看来 DivX (俗称压缩电影)蓬勃发展的大潮是势不可挡了。

看来任何吸引眼球的故事在关键时刻都会发生转折, DivX 的发展竟也不能脱离这一俗套,就在 DivX 顺利发展时期, DivX 的技术逐渐成熟,商机无限的时候,一台好戏上演了, DivXNetworks 成立初衷就是摆脱微软的技术封闭,因而发起一个完全开放源码的项目,名为 “ Projet Mayo ”,目标是开发一套全新的、开放源码的 MPEG4 编码软件,由于它完全符合 ISO   MPEG 标准,又是完全开放源代码, OpenDivXCODEC 吸引了很多软件,视频高手参与,很快便开发出具有更高性能的编码器 Encore2 等等,就在 DivX 最辉煌的时期, DXN 公司突然封闭了 DivX 的源代码,并在 Encore2 的基础上发布了自有产品 DivX4 ,原来 DXN 早就给自己留了后门, DivX 采取的是 LGPL 协议,而不是 GPL 协议,虽说它们都是公共许可证协议,保障自由使用和修改软件或源码的权利,但 LGPL 允许私有, DXN 就是利用这一协议初其不备的耍出了大刀。

接着,很多被 DXN 公司狠狠涮了一回的软件、视频团体另起门户,逐渐重新聚拢开发力量,高举复仇大旗,在 OpenDivX 版本基础上,再次开发出一种新的 MPEG 4 编码 --XviD ,名字的顺序和 DviX 刚好相反,仅仅从名字就可以看出 Xvid 充满了复仇的力量。

DivX 是近一两年来称霸网络视频的图像压缩编码标准。起初它是以微软 MPEG 4 视频编码标准为基础修改和开发的,并以免费方式发布。其特点是具有十分不错的压缩比率,可以将一整套 DVD 质量的影片压缩存放到一张 CD-R 光盘中。现在的 DivX 分为普通版和 Pro 版,其中后者还有收费版和 Adware (广告)版两种,自带 DivX Player 程序进行播放。用户如果安装了免费的 DivX Codec 后,也可用 Windows Media player 观看 DivX 影片。

官方网站: http://www.divx.com

4 Koepi's XviD Codec

相比起前三种视频编码标准来说, Xvid 推出市场的时间最迟。从其名字就知道这种标准是针对 DivX 而来的。原来, DivX 由免费转为收费编码后,使部份原有开发人员不满,继而离开并组成一个新的开发小组,设计免费且开放源代码的 XviD Codec 。当前, Koepi Nic XviD 都是比较活跃和最多人使用的版本,虽然两者在编译上有所不同,但实际做出的效果相差无几。 Xivd DivX 一样,在编译后都是一个 .AVI 文件,播放时只要安装 Xvid codec 就能用 Windows 媒体播放器中播放。

官方网站: http://roeder.goe.net/~koepi

 

视频压缩基本概念:
一、有损和无损压缩 在视频压缩中有损( Lossy )和无损( Lossless )的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用 RLE 行 程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢 复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越 差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。

二、帧内和帧间压缩 帧内( Intraframe )压缩也称为空间压缩( Spatial compression )。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。
   
采用帧间( Interframe )压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩( Temporal compression ),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值( Frame differencing )算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。

三、对称和不对称编码 对称性( symmetric )是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,尔后再播放,因此可以采用不对称( asymmetric )编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要 10 多分钟的时间,而该片断实时回放时间只有三分钟。

 

 

第三部分:音频文件格式

 

一些音视频的参数含义 :

声道: 目前人们所使用的各种声场技术规范非常多,但最常见的几乎都来自三家公司,他们是 Dolby (杜比)、 HTX DTS 声卡所支持的声道数是衡量声卡档次的重要指标之一,从单声道到最新的环绕立体声,下面一一详细介绍: 1. 单声道: 单声道是比较原始的声音复制形式,早期的声卡采用的比较普遍。当通过两个扬声器回放单声道信息的时候,我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的。这种缺乏位置感的录制方式用现在的眼光看自然是很落后的,但在声卡刚刚起步时,已经是非常先进的技术了。 2. 立体声: 单 声道缺乏对声音的位置定位,而立体声技术则彻底改变了这一状况。声音在录制过程中被分配到两个独立的声道,从而达到了很好的声音定位效果。这种技术在音乐 欣赏中显得尤为有用,听众可以清晰地分辨出各种乐器来自的方向,从而使音乐更富想象力,更加接近于临场感受。立体声技术广泛运用于自 Sound Blaster Pro 以后的大量声卡,成为了影响深远的一个音频标准。时至今日,立体声依然是许多产品遵循的技术标准。 3. 准立体声: 准立体声声卡的基本概念就是:在录制声音的时候采用单声道,而放音有时是立体声,有时是单声道。采用这种技术的声卡也曾在市面上流行过一段时间,但现在已经销声匿迹了。 4. 四声道环绕: 人们的欲望是无止境的,立体声虽然满足了人们对左右声道位置感体验的要求,但是随着技术的进一步发展,大家逐渐发现双声道已经越来越不能满足我们的需求。由于 PCI 声卡的出现带来了许多新的技术,其中发展最为神速的当数三维音效。三维音效的主旨是为人们带来一个虚拟的声音环境,通过特殊的 HRTF 技术营造一个趋于真实的声场,从而获得更好的游戏听觉效果和声场定位。而要达到好的效果,仅仅依靠两个音箱是远远不够的,所以立体声技术在三维音效面前就显得捉襟见肘了,但四声道环绕音频技术则很好的解决了这一问题。四声道环绕规定了 4 个发音点:前左、前右,后左、后右,听众则被包围在这中间。同时还建议增加一个低音音箱,以加强对低频信号的回放处理 ( 这也就是如今 4.1 声道音箱系统广泛流行的原因 ) 。就整体效果而言,四声道系统可以为听众带来来自多个不同方向的声音环绕,可以获得身临各种不同环境的听觉感受,给用户以全新的体验。如今四声道技术已经广泛融入于各类中高档声卡的设计中,成为未来发展的主流趋势。 5.5.1 声道 5.1 声道已广泛运用于各类传统影院和家庭影院中,一些比较知名的声音录制压缩格式,譬如杜比 AC-3 Dolby Digital )、 DTS 等都是以 5.1 声音系统为技术蓝本的。其实 5.1 声音系统来源于 4.1 环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于 80Hz 的声音信号,在欣赏影片时有利于加强人声,把对话集中在整个声场的中部,以增加整体效果。相信每一个真正体验过 Dolby AC-3 音效的朋友都会为 5.1 声道所折服。千万不要以为 5.1 已经是环绕立体声的顶峰了,更强大的 7.1 系统已经出现了。它在 5.1 的基础上又增加了中左和中右两个发音点,以求达到更加完美的境界。由于成本比较高,没有广泛普及。

 

 

.WMA
   WMA 的全称是 Windows Media Audio ,是微软力推的一种音频格式。 WMA 格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到 1:18 ,生成的文件大小只有相应 MP3 文件的一半。此外, WMA 还可以通过 DRM Digital Rights Management )方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。

优点
WMA 7
之后的 WMA 支持证书加密,未经许可(即未获得许可证书),即使是非法拷贝到本地,也是无法收听的。同时,微软公司开始时宣称的:同文件比 MP3 体积小一倍而音质不变,也得到了兑现。事实上,这个说法,仅仅适用于低比特率的情况,另外,微软公司在 WMA 9 大幅改进了其引擎,实际上几乎可以在同文件同音质下比相同的 MP3 体积少 1/3 左右。
缺点
在高比率的渲染能力低下,同音源的一个 320KBPS MP3 与比较 192KBPS WMA 相比,音质和渲染力很容易分别出是前者较优。

   .VQF
   VQF TwinVQ Transform domain Weighted Interleave Vector Quantization ),是由 NTT Nippon Telegraph and Telephone )与 Yamaha 共同开发的一种音频压缩技术。 VQF 的音频压缩率比标准的 MPEG 音频压缩率高出近一倍,可以达到 18:1 左右甚至更高。也就是说把一首 4 分钟的歌曲( WAV 文件)压成 MP3 ,大约需要 4MB 左右的硬盘空间,而同一首歌曲,如果使用 VQF 音频压缩技术的话,那只需要 2MB 左右的硬盘空间。因此,在音频压缩率方面, MP3 RA 都不是 VQF 的对手。

但是 VQF 不支持 " " ,这可能也是为什么现在它完全被 WMA 压下去的一个主要原因 .

   .MP3
MP3 的全称是 Moving Picture Experts Group Audio Layer III 。简单的说, MP3 就是一种音频压缩技术,由于这种压缩方式的全称叫 MPEG Audio Layer3 ,所以人们把它简称为 MP3 MP3 是利用 MPEG Audio Layer 3 的技术,将音乐以 1:10 甚至 1:12 的压缩率,压缩成容量较小的 file ,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为 MP3 体积小,音质高的特点使得 MP3 格式几乎成为网上音乐的代名词。每分钟音乐的 MP3 格式只有 1MB 左右大小,这样每首歌的大小只有 3-4 兆字节。使用 MP3 播放器对 MP3 文件进行实时的解压缩 ( 解码 ) ,这样,高品质的 MP3 音乐就播放出来了。   

MP3 最受争议的就是音质问题 ( 尤其是随着 WMA 的普及 ) ,其高频损失很大,很多 MP3 编码器粗糙的编码算法不但导致高频丢失,还丢失了许多细节,类似吉他擦弦的感觉在 MP3 中是找不到的 . 在对 MP3 快要失望时,偶发现了 Lame, 它支持根据人耳遮蔽效应原理来分析波形,配合 VBR 技术,可以让音质达到令人吃惊的地步 ; 其独创的心理音响模型技术保证了 CD 音频还原的真实性,配合 VBR( 动态比特率 ) ABR( 平均比特率 ) 参数,编码出来的 MP3 音色纯厚、空间宽广、低音清晰、细节表现良好 , 音质几乎可以媲美 CD 音频,但文件体积却非常小 . 很多网友在使用 LAME 后的反映就是:立刻删除硬盘上所有的 MP3 和其他编码器,全部用 Lame 重新来过。 Lame 提供 EXE DLL ,其中 DLL 是作为标准的动态运行库供其他程序调用 .EXE Command Line 程序,象 DOS 程序一样工作,两者彼此独立,互不关联。但大家很快能发现两者编码的质量是不一样的 , 那是由于 dll 可控性差,与具备丰富调节参数的 EXE 版相比,其压缩出来的 MP3 效果稍逊一筹。但 EXE 是一个命令行工具,操作很麻烦,幸亏有了 WinLAMEr lameGUIxp 这些 Shell 。只要学会使用这些 Shell( 是傻瓜型的 , 一看即会 ) ,就可以用 LAME 压缩出最最精彩的 MP3 了。再说说 APS, LAME 出现以前, APS 就是最好的 MP3 编码器,它使用的 Fraunhofer IIS 编码算法,这比 LAME 使用的编码算法要先进,在 192k Bitrate(CBR) 下,甚至比 LAME 编码的曲子要优秀,细节明显要丰富一些,但 APS 本身不支持 VBR ,当 Bitrate 往上提高时,音质就要比 LAME 编码的要差了,大部分朋友的 MP3 的一般都是 128-192K Bitrate 的,因此 APS 仍旧有推荐的价值。特别是有很多 MP3 随身听不支持 VBR 256K Bitrate 以上的 MP3 LAME 就不一定合适这些朋友了, APS 就成了不错的选择,由它编码的曲子,绝对不会辱没你昂贵的 PLAYER.

   .MP3PRO
   MP3PRO 完全是基于传统 MP3 编码技术的一种改良,本身最大的技术亮点就在于 SBR(Spectral Band Replication 频段复制 ), 这是一种新的音频编码增强算法 . 它提供了改善低位率情况下音频和语音编码的性能的可能 . 这种方法可在指定的位率下增加音频的带宽或改善编码效率 ,SBR 最大的优势就是在低数据速率下实现非常高效的编码 . 如果在高数据速率的情况下, SBR 将如同虚设 . 当制作 MP3PRO 文件时,编码器将音频分为两部分。一部分是将音频数据中的低频段部分分离出来,通过传统的 MP3 技术而编码得出的正常的 MP3 音频流,此举可令到 MP3 编码器可以专注于低频段信号从而获得更好的压缩质量,而且原来的 MP3 播放器也可播放 MP3PRO 文件。另一部分则是将分离出来的高频段信号进行编码并嵌入到 MP3 流中,传统的 MP3 播放器会将其忽略掉,而新的 MP3PRO 播放器则可从中还原出高频信号,并将两者进行组合,得到高质量的全带宽的声音 . 官方宣称通过这样的技术,使得 MP3PRO 能在 64kbps 的编码率便可提供与 128kbps mp3 相同的质量。低比特率下 MP3PRO 的性能很明显地比 MP3 要高 , 但是它与 WMA 谁胜谁负就很难说了 , 根据一些发烧友的评测 , MP3PRO 似乎略胜一些 . 高比特率下很少有人用到 MP3PRO.

 

.OGG
   OGG 格式的全称应该是 OGG Vobis 。它是一种新的音频压缩格式,类似于 MP3 等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。 OGG Vobis 有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听 DTS 编码的多声道作品将不会是梦想。 OGG Vobis 在压缩技术上比 MP3 好,而且它的多声道,免费,开源这些特点,使它很有可能成为一个流行的趋势,这也正是一些 MP3 播放器对其支持的原因

在高音质要求下 , 有损音频编码世界中是三足项立,分别为 MP3 MPC OGG 。 

Ogg Vorbis 中的主要算法还是利用MDCT (修饰离散余弦变换Modified Discrete Cosine Transform  )而不是用现在比较时兴的小波(wavelet )技术。Ogg 的多通道编码技术,统称为立体声通道耦合Stereo Channel Coupling 。而该技术实际又是由两种不同的技术组成的:channel interleaving  square polar mapping ,而这也是Ogg 能成为免费制式的一个必要条件,以往的 联合立体声Joint Stereo” 的编码模式是有专利限制的。据官方声称,与其他会造成立体空间感减弱的编码模型相比,这两种技术都可以在保持编码器的灵活性的同时而不损害本来的立体声空间影像 ―― 相信配合 iRiver 3d 音效会有更好的表现力,而且实现的复杂程度比联合立体声方式要低。
   OGG Vorbis 这种编码也远比 90 年代开发成功的 MP3 先进,它可以在相对较低的数据速率下实现比 MP3 更好的音质! ―― 我认为 Ogg 很象 MD atrac 格式,特别象新的 lp2 编码,它能在低别特率下有着很要的音质。此外,在编码上, Ogg Vorbis 是使用了 VBR (可变比特率)和 ABR (平均比特率)方式进行编码,所以理论上, Ogg Vorbis 带来的音乐可以比采用 CBR 文件有更好的声音表现,当然前提是两者使用同样比特率 (Bit Rate) 的压缩模式 ―― 这里可以知道。 Ogg Vorbis 的比特率缩放功能可以在不用重新编码的情况下调节文件的相关压缩率,与此同时, Ogg 文件的单位编辑能力和超越左右声道的音频流技术可以带来更为奇妙的音乐享受。 Vorbis 还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。
   Vorbis 文件可以被分成小块并以样本粒度( granularity ,专业术语,指数据可以被分割的最小尺寸)进行编辑; Vorbis 支持多通道(大于 2 )音频流并使用了独创性的处理技术;这意味着什么?这意味着 Ogg Vorbis SACD DTSCD DVD AUDIO 抓轨软件(目前这种软件还没有)的支持下,可以对所有的声道进行编码,而不是 MP3 只能编码 2 个声道。多声道音乐的兴起,给音乐欣赏带来了革命性的变化,尤其在欣赏交响时,会带来更多临场感。这场革命性的变化是 MP3 无法适应的。在以后的播放技术不断提高以后,而且人们对音质要求不断提高, Ogg 的优势将更加明显。
   . MPC
   MusePaCk 是由德国人 Andree Buschmann 开发的一种完全免费的高品质音频格式。在其问世之前, Lame MP3 是公认音质最好的有损压缩方案,追求音质的人对它趋之若鹜。但现在这个桂冠无疑该让给 MPC 了,在中高码率下, MPC 可以做到比 MP3 更好音质。在高码率下, MPC 的高频要比 MP3 细腻不少,可以在节省大量空间的前提下获得最佳音质的音乐欣赏,是目前最适合用于音乐欣赏的有损编码。

MPC 的编码方案是在 MP2 的基础上改进而来。它同样采用子带编码技术,但相比 MP2 ,它所采用的心理声学模型要优秀得多,并加入了像 ANS Adaptive Noise Shaping )、 CVD(ClearVoiceDetection) 等技术,甚至改变了压缩时所用的 Huffman (哈夫曼)编码,以得到更大的压缩率。另外, MPC 采用的是可变码率进行编码。毫无疑问,可变码率的编码效率要高于固定码率,因为前者可以合理地分配数据量,在信号复杂(微弱)时提高(降低)比特率,在得到满意的效果又能确保不错的压缩率。为了保证高音质, MPC 的瞬间最大码率甚至高达 1.32Mbps ,这已经快接近 CD 1.41Mbps

较高比特率下 (250kbps 左右 ),MPC 表现非常的出众 , 甚至超过了 MP3 ,很难分辨它和原始信号有多少区别,无论从频率保留还是细节保留,以及信号强度失真来说, MPC 太优秀了 . MPC 并非万能的,它无法编码 48khz 采样率的曲子,所幸的是,这样的曲子来源很少 . 可惜这种格式并没有像 MP3 WMA 那样流行 .

   .ATRAC
   ATRAC Adaptive TRansform Acoustic Coding 自适应声学转换编码技术):是 Sony 的原创音乐压缩技术,主要用于 MD Walkman 的录音及播放方面。是一项基于听觉心理学领域的研究和不损伤可闻声质量的数码音频译码压缩技术,对音乐资讯有效的进行压缩,压缩的比率为原来的五分之一,因为 MD 使用了 ATRAC 压缩技术,这样的压缩大大节省了许多空间,所以  CD 的碟片要 120mm 大小,而 MD 只需 64mm 就可以录下 74 分钟的音乐。

ATRAC 压 缩技术主要是利用了人耳的蔽遮效应,在心理声学原理上,在进行音频录入的同时,有许多外部的频段同时也会被录入,当人耳同时听到两个不同频率、不同音量的 声音时,音量较小的低频及音量较小的高频连同不为人耳所察觉的频段信号都会被自动减弱或忽略不予记录,因此又可以称为适应性变换声码技术,由于近年來编码 压缩技术( ATRAC 的版本)越來越成熟,所以经过编码解码过程后的声音仍直逼 CD ,大家就不必担心音质差啦。

ATRAC 16 比特 44.1KHz 的数字信号以频率响应轴分成 52 个区段(在低频时分割较细而在高频时分割较粗),根据声音心理学的原理,将声音信号中人耳听不到和对人的听力影响不大的信息给剔除出去而达到缩小声音文件的目的。利用这种原理, ATRAC 可以将录音的资料量压缩为原来的五分之一(即压缩比为 1 5 )。

.

   . APE  
     APE 的本质,其实它是一种无损压缩音频格式。庞大的 WAV 音频文件可以通过 Monkey''s Audio 这个软件进行 瘦身 压缩为 APE 。很时候它被用做网络音频文件传输,因为被压缩后的 APE 文件容量要比 WAV 源文件小一半多,可以节约传输所用的时间。更重要的是,通过 Monkey''s Audio 解压缩还原以后得到的 WAV 文件可以做到与压缩前的源文件完全一致。所以 APE 被誉为 无损音频压缩格式 Monkey''s Audio 被誉为 无损音频压缩软件 。与采用 WinZip 或者 WinRAR 这类专业数据压缩软件来压缩音频文件不同,压缩之后的 APE 音频文件是可以直接被播放的。   Monkey''s Audio 会向Winamp 中安装一个“in_APE.dll” 插件,从而使Winamp 也具备播放APE 文件的能力。 

和上面介绍的几款编码不同的是,这个编码提供了最好的音质保证 ( 无损压缩 ) !还提供了 Winamp 的插件支持 , 可以直接用 Winamp 来播放 . 所谓无损就是指压缩后的格式和源文件在音质上并无差异,而 Mp3 WMA 等的编码方案是基于有损的,在损失部分音质的前提下节约存贮空间,所以说音质再好的 Mp3 WMA 也只能是无限接近源文件的音质。 APE 非常适合来编码讲究细节的独奏曲目和大动态的交响曲。向各位音乐迷们 ( 不是歌迷 ) 作最强烈的推荐!它的压缩比约为 2:1.

   . WAV
   WAV 是录音时用的标准的 windows 文件格式,文件的扩展名为 .wav WAVE 文件作为最经典的 Windows 多媒体音频格式,应用非常广泛。声道有单声道和立体声之分,采样频率一般有 11kHz 22kHz 44kHz 三种。

WAVE 文件所占容量 = (采样频率 × 采样位数 × 声道) × 时间 /8 1 字节 =8bit )。

   WAV 文件与 MIDIMP3 这类多媒体声音文件比较起来,所占的硬盘空间要大得多,但 WAV 文件的回放效果是最好的, WAV 文件直接反映了一个声音在每个时刻的大小值, 1 分钟 44khz 采样率的 WAV 文件就会占用 10M 硬盘空间!

它通常作为制作高质量音乐的中间体
   .RM
   Real Networks 公司所制定的音频视频压缩规范称为Real Media ,用户可以使用RealPlayer RealOne Player 对符合RealMedia 技术规范的网络音频/ 视频资源进行实况转播并且RealMedia 可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用RealPlayerRealOne Player 播放器可以在不下载音频/ 视频内容的条件下实现在线播放。另外,RM 作为目前主流网络视频格式,它还可以通过其Real Server 服务器将其它格式的视频转换成RM 视频并由Real Server 服务器负责对外发布和播放。RM ASF 格式可以说各有千秋,通常 RM 视频更柔和一些,而 ASF 视频则相对清晰一些。
  RM
格式一开始就定位在视频流应用方面,也可以说是视频流技术的始创者。它可以在用 56 K Modem 拨号上网的条件下实现不间断的视频播放,当然,其图像质量和 MPEG2 DIVX 等相比有一定差距,毕竟要实现在网上传输不间断的视频是需要很大带宽的。

RM 已经是昨日黄花,没有任何新意,低 Bitrate 比不过 WMA ,高 Bitrate 比不过 MP3 ,虽然新的 RM 导入了 ATRAC3 算法,但颓势已定,很难东山再起了。

 

 

 

 

 

第四部分:一些 ffmpeg mencoder 的实例

ffmpeg -i test.avi -ab 56 -ar 22050 -b 500 -r 15 -s 320x240 test.flv  

ffmpeg 参数设定解说  
-bitexact 
使用标准比特率  
-vcodec xvid 
使用 xvid 压缩  
-s 320x240 
指定分辨率  
-r 29.97 
桢速率(可以改,确认非标准桢率会导致音画不同步,所以只能设定为 15 或者 29.97  
画面部分,选其一  
-b <
比特率 指定压缩比特率,似乎 ffmpeg 是自动 VBR 的,指定了就大概是平均比特率,比如 768 1500 这样的
就是原来默认项目中有的  
-qscale <
数值 < 数值 > 质量为基础的 VBR ,取值 0.01-255 ,约小质量越好  
-qmin <
数值 设定最小质量,与 -qmax (设定最大质量)共用,比如 -qmin 10 -qmax 31 
-sameq 
使用和源同样的质量  
声音部分  
-acodec aac 
设定声音编码  
-ac <
数值 设定声道数, 1 就是单声道, 2 就是立体声,转换单声道的 TVrip 可以用 1 (节省一半容量),高品质
DVDrip 就可以用
-ar <
采样率 设定声音采样率, PSP 只认 24000 
-ab <
比特率 设定声音比特率,前面 -ac 设为立体声时要以一半比特率来设置,比如 192kbps 的就设成 96 ,转换
君默认比特率都较小,要听到较高品质声音的话建议设到 160kbps 80 )以上  
-vol <
百分比 设定音量,某些 DVDrip AC3 轨音量极小,转换时可以用这个提高音量,比如 200 就是原来的 2  
这样,要得到一个高画质音质低容量的 MP4 的话,首先画面最好不要用固定比特率,而用 VBR 参数让程序自己去
判断,而音质参数可以在原来的基础上提升一点,听起来要舒服很多,也不会太大(看情况调整)

 


转自:http://blog.myspace.cn/e/402164715.htm
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值