(转)各种音视频编解码学习详解 h264 ,mpeg4 ,aac 等所有音视频格式(二)

编解码学习笔记(七):微软Windows Media系列

资料来源于wiki与 http://chaoqunz.blog.163.com/blog/static/6154877720084493941186/

Microsoft 公司主导的音频视频编码系列,它的出现主要是为了进行网络视频传输,现在已经向HDTV 方面进军,开发了 WMV HD 应用。WMV(Windows Media Video)是微软公司开发的一组数字视频编 解码格式的通称,它是Windows Media架构下的一部分。它最初是为低速率流媒体应用作为专有编解码开发出来的,但是2003年微软公司基于Windows Media Video第9版编解码起草了视频编解码规范并且提交给SMPTE申请作为标准。这个标准在2006年3月作为SMPTE 421M被正式批准,这样Windows Media Video 9编解码就不再是一个专有的技术。早期的变解码版本(7和8)仍然被认为是专有技术,因为它们不在SMPTE 421M标准的涵盖范围内。

微软媒体系列分为WMV(Windows Media Video)和WMA(Windows Media Audio),说白了就是微软的视频和音频。

容器

视 频流通常与Windows Media Audio音频流组合在一起并且使用扩展名为.wmv或者.asf的Advanced Streaming Format的文件进行封装。WMV通常使用Advanced StreamingFormat(ASF) 封装,它也可以使用AVI或者Matroska格 式封装。如果是AVI封装的文件结果文件可以是.avi,如果是ASF封装的话则是.wmv或者.asf, 如果是MKV封装的话则是.mkv。当使用VirtualDub编 码器编码和WMV9 VCM编解码实现的时候WMV可以存储在AVI文件中。用于Mac的微软公司媒体播放器不支持所有的WMV编码的文 件,因为它只支持ASF文件 封装,Flip4Mac和QuickTime或 者用于MacOSX的MPlayer可 以播放更多的文件。

WMV

扩展名: .wmv
互联网媒体类型: video/x-ms-wmv
统一类型标识: com.microsoft.windows-?media-wmv
开发者: 微软公司
格式: 数字视频

WMV(Windows Media Video)是微软公司开发的一组数字视频编解码格式的通称,它是Windows Media架构下的一部分。它最初是为低速率流媒体应用作为专有编解码开发出来的,但是2003年微软公司基于Windows Media Video第9版编解码起草了视频编解码规范并且提交给SMPTE申请作为标准。这个标准在2006年3月作为SMPTE 421M被正式批准,这样Windows Media Video 9编解码就不再是一个专有的技术。早期的变解码版本(7和8)仍然被认为是专有技术,因为它们不在SMPTE 421M标准的涵盖范围内。

WMV 不是仅仅基于微软公司的自有技术开发的。从第七版(WMV1)开始,微软公司开始使用它自己非标准MPEG- 4 Part 2。但是,由于WMV第九版已经是SMPTE的一个独立标准(421M,也称为VC- 1),有理由相信WMV的发展已经不像之前那样是一个它自己专有的编解码技术。现在VC-1专利共享的企业有16家(2006年4月),微软公司也是 MPEG-4 AVC/H.264专利共享企业中的一家。

正式名称

FourCC

Codec版本

描述

Windows Media Video v7

WMV1

0

 

Microsoft MPEG-4 Video Codec v3

MP43

1

 

Windows Media Video v8

WMV2

2

 

Microsoft MPEG-4 Video Codec v2

MP42

3

 

Microsoft ISO MPEG-4 Video Codec v1

MP4S

4

 

Windows Media Video v9

WMV3

5

 

Windows Media Video v9 Advanced Profile

WMVA

6

deprecated as not VC-1 不完全兼容。

Windows Media Video v9 Advanced Profile

WVC1

7

VC-1完整支持

FourCC 全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来 编码的。因此wav、avi大量存在等于“IDP3”的FourCC。

Microsoft MPEG-4 v1/v2/v3

常见的有1.0、2.0、3.0三种版本,是基于MPEG-4技术的,其中3.0并不能用于AVI的编码,只能用于生成支持“视频流”技术的ASF文件。

Microsoft MPEG-4 version 1
是微软基础的视频编码,是非标准的MPEG-4,与MPEG-4 Part2不兼容。FourCC:MPG4

Microsoft MPEG-4 version 2
VFW 的基础编解码。与V与MPEG-4Part2不兼容。VFW(Video for Windows),是微软推出的关于数字视频的一个软件开发包,VFW的核心是AVI文件标准。AVI(AudioVideo Interleave)文件中的音、视频数据帧交错存放。围绕AVI文件,VFW推出了一整套完整的视频采集、压缩、解压缩、回放和编辑的应用程序接口 (API)。由于AVI文件格式推出较早且在数字视频技术中有广泛的应用,所以VFW仍然有很大的实用价值,而且进一步发展的趋势。在VC++开发环境中 调用VFW和使用其它开发包没有什么不同,只是需要将VFW32.lib 文件加入工程中,但在开放视频捕捉与压缩管理程序时需要其它软件硬件设置。VFW为AVI文件提供了丰富的处理函数和宏定义,AVI文件的特点在于它是典 型的数据流文件,它由视频流、音频流、文本流组成。所以对AVI文件的处理主要是处理文件流。FourCC:MP42

Microsoft MPEG-4 version 3
VFW的基础编解码。与V与MPEG-4Part2不兼容。最终只用于ASF文件。FourCC:MP43

除此之外:
Microsoft ISO MPEG-4 version 1
基于DirectX Media Objects (DMO)-based编解码,与MPEG-4 SP(Simple Profile)兼容 。FourCC:MP4S。

Microsoft ISO MPEG-4 version 1.1
与MPEG-4 ASP(AdvancedSimple Profile)兼容。FourCC:M4S2

目 前在Windows平台上比较实用的MPEG-4视频编解码器主要有:由微软公司开发的Microsoft MPEG-4 Codec v1/v2 /v3,主要是配合微软公司的流媒体技术使用;在Microsoft MPEG-4 v3的基础上,由DivXNetworks公司开发的 DivX Codec;在OpenDivX的基础,遵循GPL开发的开源XviD Codec。
这些codec在windows中以dll方式呈现。

Windows Media Video 7

是DirectXMedia Objects (DMO)-based codec。Microsoft 正式开发的 第一个 Windows Media Video,开始脱离了MPEG-4,和MPEG-4 不兼容,从这一点上可见微软的野心(微软公司开始使用它自己非标准MPEG-4Part 2)。可惜这个版本压缩效果非常烂,打破了微软一飞冲天的美梦,不过它在压缩速度上非常快,现在网络上有很多采用这种格式压缩的 WMV。FourCC:WMV1

Windows Media Video 8

在WMV7 基 础上改进的版本,质量上面进不了不少。是DMO-based codec。FourCC:WMV2.

Windows Media Video 9

微 软的重头戏,不光是这一个编码,V9 系列更是一个平台,让微软有足够的能力挑战 MPEG,ITU 等标准化组织。虽然这个版本并没有微软吹得那么厉害,特别 是低码率下比较差,不过跟以前版本相比进步还是非常多的。特别是 WMV HD 的应用,让微软也跻身视频标准领域。
DMO-based codec. Video for Windows (VfW/VCM) version also available. FourCC:WMV3

Windows Media Video 9 Advanced Profile

在 WMV4的Simple和Main profile levels与VC-1标准中的是相同的。VC-1中的AdvancedProfile采用一个新的WMV编解码,称为WindowsMedia Video 9 Advanced Profile。它提高隔行扫描的内容压缩,并与传输无关,使得他可以封装在MPEG的传输流(TS)中或者采用RTP传输。它与之前的WMV9的 codec是不兼容的。

随着 Windows Media Player 10 推出的编码器,能够更进一步控制WMV9 的质量。但是不能在老版本的 WMP9 上播放,也就是不兼容老版本的 WMP9,真不知微软在搞什么?

FourCC:WVC1,VC-1兼容。FourCC:WMVA,不推荐使用非VC-1兼容方式。我们可以认为WMV9与VC-1兼容。

Windows Media Video 9 Screen

静 态屏幕无损压缩编码,质量非常好,压缩率高,只针对如屏幕等变化非常小的环境。WMV Screen是一个screencast编解码器,它可以捕抓动态的屏幕内容,将第三方抓屏程序转换到WMV9 Screen文件中。用于之一是计算机的step-by*step演示视频,第一版本是WMV7 Screen,第二个版本也就是当前的版本是WMV9 Screen,支持CBR和VBR。

Windows Media Video 9 Image

静 态图像压缩编码。WMV Image是一个视频幻灯片的编码器,播放多个画面时可根据时间进行平移和过度效果展现。与WMV9相比,具有高压缩率和高态图像质量。由于编解码依赖解 码器(播放器)生成实施视频帧,播放WMV Image文件(即使在普通的1024×768,30fps)要求很高的处理能力。在最新的版本,WMV9.1 Image,使用Photo Story3提高转换效果,耽于原来的WMV9 Image不兼容。

视频质量

微软宣称WMV9提供的压缩率为MPEG-4的2倍,MPEG-2的3倍。微软还宣称WMV9的压缩效率笔WMV8高15%~50%。但是在2005年的一个测试报告中,显示WMV9的压缩效率比WMV8要差。

Windows Media Player 10 Mobile

在wiki上,我们注意到“Windows Media Player 10 Mobile”,显示WMV10将用于移动,可能是Windows Mobile。但是我们没有查到进一步的资料。

WMA

扩展名 .wma
互联网媒体类型 audio/x-ms-wma
统一类型标识 com.microsoft.windows-?media-wma
开发者 微软
格式 数字音频

WMA(Windows Media Audio)是微软公司开发的一种数字音频压缩格式。一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。WMA格式为微软公司私有,但是随着苹果公司的iTunes对它的支持,这 个格式正在成为MP3格式的竞争对手。它兼容MP3的ID3元数据标签,同时支持额外的标签。

WMA可以用于 多种格式的编码文件中。应用程序可以使用Windows MediaFormat SDK进行WMA格式的编码和解码。一些常见的支持WMA的应用程序包括Windows Media Player、Windows Media Encoder、RealPlayer、Winamp等等。其它一些平台,例如Linux和移动设备中的软硬件也支持此格式。

WMA 7之后的WMA支持证书加密,未经许可(即未获得许可证书),即使是非法拷贝到本地,也是无法收听的。同时,微软公司开始时宣称的:同文件比MP3体积小 一倍而音质不变,这也得到了兑现。另外,微软公司在WMA 9大幅改进了其引擎,实际上几乎可以在同文件同音质下比MP3体积少1/3左右,因此非常适合用于网络流媒体。

跟 MP3相比,WMA在高位的音质渲染力明显不足,甚至还比MP3更差;与MP3相同,通常的WMA也是有损数据压缩的文件格式,对于有更高要求的用户来说 WMA并不是一个适合的格式。但在WMA9版本开始支持无损压缩——Windows Media Audio 9 Lossless(在安装WMP11或Windows Media Format 11之后升级至9.1,无损压缩版本最高支持5.1声道编码)。此外WMA也与MP3一样同为有专利版权的文件格式。支持的设备需要购买使用版权。

Windows Media Audio v1/v2

微软最早的音频编码技术,用于 ASF 中,后来被破解也用在 DivX Audio 中,质量比较差。

Windows Media Audio 7/8/9

随着各种不同的 WMV 而推出的相应的音频编码,质量节节提升,不过还没有达到 64kbps CD音质的神化。

Windows Media Audio 9 Professional

WMA9 中 出现的新编码,主要用于多声道编码和高采样率音频的编码,质量不错。

Windows Media Audio 9 Voice

针对语音的编码,最高 20kbps ,不过和 AMR 相比,效果就太差了。

Windows Media Audio 9 Lossless

无损音频编码,可以完美保留CD原质量,是CD备份的不错选择,不过代价是体积过大。

VC-1

VC- 1,全名VC-1视讯编解码器(Video Codec 1),是基于微软WMV9,并推广为工业标准。2003年提出标准化申请,最早名字是VC-9。2006年4月正式通过成为标准。VC-1是SMPTE 421M视频编解码标准的正式名称。HD DVD 和蓝光光碟(Blu-ray Disc)都支援VC-1。微软表示Windows Vista将支援VC-1影像压缩技术的HD DVD规格。电影及电视学会(SMPTE)已采用VC-1为视讯压缩标准。

VC-1是基于Windows Media Video 9压缩技术的影像压缩标准,由三大编解码元件所组成,每一个编解码元件都具有其独自的FourCC编码。

WMV3 :

即 WMV9。VC-1的Simple和Main这两种Profile就是WMV3应用,使得与WMV 9兼容,支持逐行扫描编解码。隔行扫描的编解码也提供,但在很快地,在微软推出WMVAdvanced profile后,不推荐采用。逐行扫描编解码用于YUV4:2:0,隔行的(不推荐)用于YUV4:1:1。

WMV3用于高质量的视频和流媒体。同样的质量,它只是MPEG-2的带宽的1/2~1/3。在商业上用于高清电影和视频的WMV HD,编码为WMV3 Main Profile @ High Level(MP@HL)。

WMVA :

它是在WMV Advanced Profile被SMPTE吸收为作为VC-1草案之间出现的。它与WVC1之间细微的差役,因此解码器也不一样,2006年起,WMVA被认为是个过时的编码,因为与VC-1不完全兼容。

WVC1 :

也就是WMV 9 Advanced Profile,实现了个更新的,完全符合的AdvancedProfile的VC-1编码标准。它支持隔行扫描内容,与底层传输无关。

压 缩技术整合了MPEG及H.264之优点,采用Biliner和Bicubic方式,次像素(Sub- Pixel)最小可达4分之1像素。VC-1只有4种动作补偿(motion composition),压缩比无法胜过H.264。VC-1在压缩时间上,明显比H.264短了许多,复杂度约只有H.264的50%,对特效电影有 很杰出的效能表现。由于H.264 使用较小尺寸的转换公式与无法调整的量化矩阵,造成不能完整保留影像的高频细节资讯。

wiki上有一篇 VC-1和H.264比较 的文章,很值得看一看。我看到这样的一个段:

VC-1:需付费。Reference decoder 并非免费,不过附赠外部文件

H.264:免费.Reference encoder 和 decoder 也是免费。此外,核查小组及M4IF邮寄名单可在一个可能会收到回答了AVC的有关问题。

除此之外,我们在Google上search H.264 license中也看到了说free的字样。但是,果真如此吗?

版权问题

我一直认为H.264是需要付费的,因此我对上面的表述不确定是否正确。我上网查了一下:也看到“H.264的基本系统无需使用版权 ,具有开放的性质,能很好地适应IP和无线网络的使用,”的字样。基于这些疑问,我上网查了一下。IP总是个麻烦的问题,最好向Andriod那样,提供平台,版权,产品维护都是手机生产厂家的事情。

MPEG LA公司是世界领先的替代技术特许服务提供商,它使用户能够通过单笔交易从多个专利持有人那里购买某项技术标准或平台所必须的全球专利权,而不必分别洽谈 各项特许权。只要独立管理的一站式专利特许权能够开启方便之门、帮助用户推广某项技术, MPEG LA公司率先采用的特许模式就能提供解决方案。MPEG LA公司的特许权之一就是MPEG-2数字视频压缩,这一技术帮助产生了消费电子历史上应用最为广泛的标准。包括57个国家逾870个MPEG-2基本专 利的MPEG-2专利组合特许权拥有至少1500家被许可人,覆盖目前全球市场上的大多数MPEG-2产品,包括机顶盒、DVD播放器、数字电视机、个人 电脑和DVD视频光盘。作为独立特许经营管理人,MPEG LA公司不与任何标准管理机构相关联,也不是任何专利权持有人的关联人。欲了解更多信息,请登录http://www.mpegla.com。 (http://www.dvbcn.com/2010-01/28-44547.html

我去MEPG-LA网上查阅,发现有AVC/H.264,也就是说这个是需要付费的。在资料中有下面的一张PPT。:

我不是很看得的懂,比如一个H.264的片子,是提供下载片子的内容供应商付钱,还是提供解码器的终端设备商需要付费?又例如使用H.264进行视频电话,小于12分钟不收费,大于12分钟收费?混乱啊。因此知识产权这摊事,还是留个专业的法律人士来负责。

编解码学习笔记(八):Real系列

下面资料从wiki中整理获取。

Real系列是RealNetworks提供的,分为RealVideo和RealAudio。

RealVideo

RealVideo 是一种影片格式由RealNetworks于 1997年所开发,至2006年时已到RealVideo版本10。它从开发伊始就定位为应用为网络上视频播放上的格式。支持多种播放的平台,包含 Windows、Mac、Linux、Solaris以及某些移动电话。相较于其它的视频编解码器,RealVideo通常可以将视频数据压缩得更小。因 此它可以在用56Kbps MODEM拨号上网的条件实现不间断的视频播放。

一般的文件扩展名为.rm/.rvm,现在广泛流行的是rmvb格式,即动态编码率的real video。

RealVideo 早期使用H.263,在RealVideo8及之后公司采用私有或者不公开的视频格式。官方的的播放器是 RealNetworks RealPlayer SP,最新的版本是v12,在多个平台,包括Windows,Macintosh,和Linux中提供。RealNetworks公司同时也开发了开源的 Helix播放器,但是在Helix项目中没有提供RealVideo,因为Real系列的编解码仍是不公开的。

RealMedia 文件可以通过RTSP在网络上传输,但是RTSP只用于建立和管理连接,真正的视频数据是通过 Real自己私有的 RDT(Real Data Transport)协议传输。这种方式引起很大的批评,因为难以在其他播放器和服务器中使用RealVideo,现在一些开源项目,例如MPlayer 已经可以播放RDT流。为了支持实时流,RealVideo和RealAudio通常采用CBR(恒定码速)编码,使得每秒传递的数据相等。后来,公司开 发了可变码速,成为RealMedia Variable Bitrate(RMVB),提供更高的水平资料,但是这种格式不适合作为流,因为难以预测某个特定的媒体流需要多少网络资源。带有快速移动和场景变化的 视频需要更高的码流,如果码流超出网络所能提供的速率,将会引起中断。

RealNetworks公司说RealVideo和RealAudio编解码的源代码不在RPSL的许可内。在许可源代码在不支持的处理器和操作系统的商用移植中许可。虽然公司拥有大多数的知识产权,但是允许第三方为某个特性享有版权。

RealVideo 1.0

RealVideo的第一个版本在1997年释放,是基于H.263格式。在RealPayer5中提供。FourCC为rv10,rv13

RealVideo G2和RealVideoG2+SVT

也是就要H.263,在RealPlayer6中提供。质量比较糟糕。FourCC为rv20

RealVideo 8

随着 RealPlayer 8 推出的视频格式,是现在主流的网络视频编码之一。编码速度较慢,质量也只能算一般。猜测是基于早期的H.264 draft,在RealPlayer 8中提供,FourCC为rv30。

RealVideo 9

RealNetworks 开 发的新一代编码,质量进步了很多,特别是在底码率下,而且编码速度很快,做到了速与质的很好统一。
猜测是基于H.264,在RealPlayer9中提供。FourCC为rv40.

RealVideo 10

在RealVideo 9 基 础上加入了一些参数,如 EHQ 等,更加精确控制码率,和 RealVideo 9 兼容。在RealPlayer10中提供,FourCC为rv40(与RealVideo9相同)

RealAudio

文件名扩展: .ra, .ram

Internet media type:audio/vnd.rn-realaudio,audio/x-pn-realaudio

RealAUdio 是RealNetwoks公司私有的宾朋编解码格式,最早在1995年释放。它包括一系列的音频编解码,从古老拨号modem的 低速率格式到高质量的音乐。可用于媒体流,过去很多的互联网电台使用RealAudio作为他们节目的实时音频流,近年使用得较少,让位与其他流行的格 式。

RealAudio文件后缀为.ra。1997年,公司开始提供视频格式成为RealVideo。将音频和视频合并是以哦那个的容器后缀为.rm。然而,最新的版本,使用.ra用于音频文件,使用.rv用于带或不带音频的视频文件,用.rmvb用于可变速率的视频文件。

.ram(Real Audio Metadata)和.smil(SynchronizedMultimedia Integration Language)文件格式用于流媒体中的链接。在很多情况下,网络并不直接链接一个RealAudio文件,而是链接.ram和.smil文件。这是一 个很小的文本文件,包括音频流的链接。当用户点击一个链接,网络浏览器下载.ram和.smil文件,并加载用户的媒体播放器,媒体播放器从文件中读取 pnm或者rtsp的URL,并开始播放流。

RealAudio文件包括多种音频编解码,每个编解码都是用FourCC(Four Character Code)来表示,介绍如下:

  • lpcJ: IS-54 VSELP (RealAudio 1)
  • 28_8: G.728 LD-CELP (RealAudio 2)
  • dnet: Dolby AC3 (RealAudio 3)
  • sipr: Sipro Lab Telecom ACELP-NET (RealAudio 4/5)
  • cook: G2/Cook Codec (RealAudio 6)
  • atrc: Sony ATRAC3 (RealAudio 8)
  • raac: MPEG-4 LC-AAC (RealAudio 9)
  • racp: MPEG-4 HE-AAC (RealAudio 10)
  • ralf: RealAudio Lossless Format (RealAudio 10)

编解码学习笔记(九):QuickTime系列

扩展名 .mov,.qt
互联网媒体类型 video/quicktime
类型代码 MooV
统一类型标识 com.apple.quicktime-movie
开发者 苹果公司
格式  媒体容器
专门属 音频、视频、文字

  或者标题可以改为Apple系列。QuickTime 并不是一个编码,而是一个多媒体平台,它的上面有众多编码,这里只针对几个主流的编码器。
  QuickTime技术拥有三种主要的组件:

  • 媒体播放器,苹果计算机在他自己的网站免费让人下载以及内建在他的计算机中。
  • QuickTime 档案格式-公开文件并且任何人都可以使用,不须权利金。
  • 软件开发工具可用于Macintosh和Windows平台。这些工具允许人们开发他们自己的软件来操作QuickTime以及其它媒体档案。这些对已注册开发人员是 免费的(注册免费)。

   苹果在Mac OS和Windows平台推出免费之官方媒体播放软件,名字为"QuickTime Player"(早期的版本简单地使用  了"MoviePlayer"这个名称)。这个播放器也包含一些媒体编辑和媒体创作的特色,但是使用者必须从 Apple购买序列号来打开这些功能,把这个播放器转变为"QuickTimePro"。

QuickTime历史:1991年到1998年:1.x- 2.x

   苹果电脑于1991年12月2日释出第一个QuickTime的版本,作为System 7上的多媒体附加功能。QuickTime的首席开发者,Bruce Leak,于1991年五月的Worldwide Developers Conference做了第一次的公开展示。他在Mac上展示苹果电脑有名的1984电视广告,在那时候是一种令人印象深刻的突破。Microsoft的 竞争技术-Video for Windows- 在1992年11 月之前都还未出现。

  第一个版本的QuickTime制定的基本架构,到现在基本上还存在未更改,包含多重电影轨道,可扩充的媒体形态支持,一种开放的文件格式,以及完整的编辑功能。原本的视频codec包含:

  • Apple视频codec(也称作"Road Pizza"),适合普通现场动作图像。
  • 动画codec,使用简单的run-length图形压缩方式,适合卡通形态的大区域颜色很适合。
  • 图形codec,对于每一点8位(8-bit-per-pixel)的图像优化,包含有抖色en:dithering的图形。

  苹果电脑在1992年后期发放了Mac操作系统的1.5版本。

   苹果电脑在1994年二月发布了QuickTime 2.0 for Mac OS版--这个是唯一的一个不免费的版本。在这个版本中加入了对音乐轨迹的支持,音乐轨迹相当于MIDI的数据,这个功能可以驱动sound- synthesis引擎自我创建于QuickTime中(使用的声音许可证来自Roland),或者是任何外部的MIDI设备,因此创建出来的声音只占用 一小部分的电影数据。

  在接下来的2.1和2.5版本中,QuickTime继续免费。工程师改良了对音乐的支持并增加了sprite轨迹,这个功能可以实现创建复杂的动画,文件大小就只比静态的图片大一点。

  QuickTime 2.0 for Windows发布于1994年11月。

QuickTime历史:1998 - 2001: 3.0 and 4.0

   运行于Mac OS的QuickTime 3.0于1998年3月30日发行。其现有的功能是免费的,但如果要获得Apple所提供的具有更多特性的QuickTime Player和Picture Viewer程序,最终用户需要通过购买一个QuickTime Pro 许可证来解除对软件的限制。

   QuickTime 3.0增加了支持图像导入的组件,从而可以从GIF、JPEG、TIFF和其他文件格式中读取图像。而通过FireWire主要作为视频数据输出的视频输 出组件同样增加了视觉效果,使程序员可以把实时技术运用到视频轨道中。一些效果甚至可以响应用户的鼠标单击,就像是电影本身的交互支持一样。

   苹果于1999年6 月10日发行了QuickTime 4.0 for Mac OS。它增加了图像导出组件,支持输出成与预导入者可以阅读的相同格式的非GIF格式(或许是因为LZW许可)。它增加了Sorenson video codec的第一个版本,并且支持streaming。

  QuickTime 4.1于2000年伊始发布,增加了在Mac OS 9及后续版本中播放超过2G的电影;并且终止了对68K Mac的支持。用户获得了操作QuickTime Player viaAppleScript的能力。

QuickTime历史:2001 - present 5.0 and later
  QuickTime 5.0 for Mac OS于2001年4月23日出现。它增加了"皮肤"功能和多处理图像压缩支持。在这一版本中只有拥有QuickTime Pro许可证的用户才可以使用全屏模式,这一做法引起了争议,至今尚未解决。

QuickTime历史:QuickTime 6.x
  QuickTime 6.0 for Mac OS,于2002年7月15日释出,第一次包括Mac OS X使用的版本。

更新至QuickTime 6

释出日期

版本

平台

特色

2002 年 7 月15 日

QuickTime 6

Mac OS 8.6 –Mac OS X ,Windows

MPEG-2 、MPEG-4 以及AAC

2003 年 1 月14 日

QuickTime6.1

Mac OS X

品质与效能的增进

2003 年 3 月31 日

QuickTime 6.1

Windows

修正CAN-2003-0168 安全性弱点

2003 年 4 月29 日

QuickTime 6.2

Mac OS X

对于iTunes 4 的支持、增进的AAC 支持

2003 年 6 月3 日

QuickTime 6.3

Mac OS X, Windows

3GPP 与AMR

2003 年 10 月16 日

QuickTime 6.4

Mac OS X, Windows

Pixlet 编码解码器、集成3GPP

2003 年 12 月18 日

QuickTime 6.5

Mac OS X, Windows

3GPP2 与AMC 移动式多媒体格式

2004 年 4 月28 日

QuickTime 6.5.1

Mac OS X, Windows

Apple Lossless

2004 年 10 月27 日

QuickTime 6.5.2

Mac OS X, Windows (对Windows 98/Me 的最后一个版本)

修正程序错误、安全性更新、以及品质与效能的增进

2005 年 10 月12 日

QuickTime 6.5.3

Mac OS X v10.2.8

 

QuickTime历史QuickTime 7.x

  更新至QuickTime 7。

更新至QuickTime 7

释出日期

版本

平台

特色

2005 年 5 月31 日

QuickTime 7.0.1

Mac OS X

修复一个关于Quartz Composer 外挂模块 的安全性问题

2005 年 7 月15 日

QuickTime 7.0.2

Mac OS X

修复程序错误与兼容性的增进

2005 年 9 月7 日

QuickTime 7.0.2

Windows 2000 /XP

第一个非预览版本释出

2005 年 10 月12 日

QuickTime 7.0.3

Mac OS X & Windows 2000 /XP

流 与H.264 的程序错误修复。
需要通过iTunes Music Store 支持视频的购买。

2005 年 10 月29 日

QuickTime 7.0.3.50

Windows 2000 /XP

 

2006 年 1 月10 日

QuickTime 7.0.4

Mac OS X & Windows 2000 /XP

第一个通用二进制 版本。
众多的程序错误修复与H.264 效能的改善。

2006 年 5 月11 日

QuickTime 7.1

Mac OS X & Windows 2000 /XP

众多的程序错误修复、对于iLife '06 的支持、以及H.264 效能的改善

2006 年 5 月31 日

QuickTime 7.1.1

Mac OS X

 

2006 年 6 月28 日

QuickTime 7.1.2

Mac OS X

Addresses an issue previewing iDVD projects.

2006 年 9 月12 日

QuickTime 7.1.3

Mac OS X & Windows 2000 /XP

程序错误修复与严重的安全性问题。

  现时QuickTime的最新版本是QuickTime 7.6,但Windows 2000可以使用的最高版本却是7.1.6。在7.5.5之前的版本,都存在Cross site scriping的安全性问题。
QuickTime的历史:QuickTime X

   QuickTime X(读作Quicktime Ten,当中 的"X"是罗马数字的十)是下一世代的QuickTime,在2008年6 月9日的WWDC上 发表。产品预期会在2009年的年中随同Mac OS X v10.6推出[3]。Version X会使用与iPhone OS相同的媒体技术,并支持更新的编码及更具效益的媒体播放功能。
Sorenson Video

Sorenson Video 2:

Sorenson Media 公 司开发的编码器,主要用于QuickTime 4 的视频编码,质量较差。

Sorenson Video 3:

Sorenson Media 公 司随 QuickTime 5发布的编码器,质量很不错,已经成为 QuickTime 的标准视频编码,网络上大部分电影预告片都采用这种编码。

Apple MPEG-4

  Apple 公司自己开发的 MPEG-4 编码器,随 QuickTime 6 发布,质量很差。

Apple H.264

  Apple 公司自己开发的 H.264 编码器,随 QuickTime 7 发布,支持 HDTV。

Audio QDesign Music

QDesign Music 1

QDesign 公司开发的音频编码器,这个版本现在已经开不到它的身影了。

QDesign Music 2

QDesign Music 的 第二个版本,也是最后一个版本,在时下这些先进的音频编码面前,它已经没有生命力了,主要应用于网上的电影预告片。

Audio Apple MPEG-4 AAC

  Apple 公司自己开发 的 AAC 编码器,质量非常好,是最优秀的 AAC 编码器之一,随 QuickTime 6 发布。

Apple Lossless

   Apple 公司开 发的无损音频编码,主要应用于 iTunes 抓取 CD。Apple Lossless(AppleLossless Audio Codec、ALAC)为苹果的无损音频压缩编码格式。 在 iTunes 上名称为 Apple Lossless。

  可将非压缩音频格式(WAV、AIFF)压缩至原先容量的40%至60%左右,编译码速度很快。也因为是无损压缩,听起来与原档案完全一样,不会因解压缩和压缩而改变。

  它在2004年4月28日公布的iTunes4.5和QuickTime6.5.1 的其中一部份。目前携带型数字多媒体播放器中只有 iPod 可播放。

  虽为非自由软件或开放原始码软件、但 Apple Lossless 的开放原始码译码器已经释出。

注:上述材料来源于wiki的整理。

编解码学习笔记(十):Ogg系列

Ogg是一个自由且开放标准的容器格式,由Xiph.Org 基金会所维护。Ogg格式并不受到软件专利的限制,并设计用于有效率地串流媒体和处理高质量的数字多媒体。

  Ogg意指一种文件格式,可以纳入各式各样自由和开放源代码的编解码器,包含音效、视频、 文字(像字幕)与元数据的处理。

OggTheora

   Theora是一个免权利金、开放格式的有损影像压缩技术,由Xiph.Org基金会开发,该基金会还开发了著名的声音编码技术Vorbis, 以及多媒体容器档案Ogg。Theora 是由 On2Technologies 公司专属的 VP3 编码器经过开放源代码后衍生而来。Theora 的命名来自于一个电视节目Max Headroom。

  Theora是一个可 变位速率、以DCT为基础的影像压缩格式。和多数的影像编码格式一样,Theora 使用了色度抽样、block basedmotion compensation 和 8×8 DCT block,也支援视 讯压缩图像类型和 视 讯压缩图像类型,但是不支持使用在 H.264 和 VC-1 的 bi-predictive frames(B-frame),Theora 也不支援 隔 行扫描, variable frame rates, 或 bit-depths larger than 8 bits per component。

  Theora 的影像流可以储存在任何的容器档案格式中,最常用的是和声音编码Vorbis一起储存在Ogg档案格式中,这种方式可以提供完全开放、免权利金的多媒体档案。此外Theora影像也可以储存在Matroska档 案中。

  Google官方blog称,Web视频目前没有一个标准,有些网站使用Flash,但这要求用户有Flash播放 器;有些使用Java播放器,但为了在JVM虚拟机中解码视频和音频用户需要一个配置很高的机器;等等诸如此类。

  好消息是新一代的 HTML 5标准引入了视频元素,Web开发者可以用一种标准的方式指定视频的外观。现在问题变成了使用哪一种视频格式。

  Google 认为开放标准格式可以成为目前无序的视频格式之争的底线。最后的权益方案不需要最复杂的格式,或者是最大张旗鼓宣传,几乎已成为行业标准的格式,因此他们决定选择支持使用广泛的开源Ogg Theora格式。

  Theora是On2 Technologies 公司的 VP3 编码器的开源衍生版,Google于去年收购了On2公司。

  资料来源:http://tech.it168.com/a2010/0412/872/000000872493.shtml

   在2002年3月,On2将许可改为下周VP3开源代码为LGPL。在2002年6月,On2将VP3作为 Xiph.Org仅仅和下的一个类似BSD的开源许可。On2还制定了一个不可更改的免版权费的声明,任何人可以用于任何软件,任何的衍生产品以及任何目 的。2002年88月,On2与Xiph.Org签订一项协议,将VP3作为一个新的,免费的视频编解码,成为Theora。On2宣称Theora是 VP3的一个继任者。在2002年10月3日,On2和Xiph宣布Theora最早的Alpha代码释放。

  比特流格式在2004年 冻结(version 1.0 alpha3),有经过了几年的beta版本,Theora第一稳定版本(v1.0)在2008年11月释放。Theora任何版本的视频编码在格式冻结 后都与未来的播放器兼容。目前的工作集中在“Thusnelda”分支的bug修复,目前为beta版本,将最后作为Theora1.1版本释放。

   Theora视频压缩格式基本上与VP3视频压缩格式兼容,包含一个后先兼容的超集。Theora是VP3和 VP3流(有小量语法修订)的超集,VP3流可以不经过重新压缩改为Theora流,但是反过来把成立。VP3视频压缩可以由Theora来实现解码,但 是Theora视频演示通常不能够使用古老的VP3来进行解码。

  Theora将视频格式建立在开源的基础上,并作为基百科视频内容选择的编码格式。然而,Theora缺少商业支持,并正努力获取分销商尤其是网络分销商接受。

  Mozilla使用这项技术在Firefox上提供HTML5视频。苹果和微软的HTML5视频都准备采用 MPEG LA管理的H.264。该团体的成员包括微软和苹果,及许多科技公司。

  这里面的争议关键在于license的问题,H.264是需要给license的。

   Mozilla则发出以下声明:“我们相信,HTML5视频在多方、开放和无权利金的编/解码器,以同于W3C 授权标准之方式支持下,才符合公众利益。如 果MPGA LA愿意根据W3C标准定义的开放网络条件提供H.264,我们绝对会考虑采用这项技术。本组织坚持我们对Theora的立场。”

  Opera首席技术官Hakon Wium Lie也提供下列声明;“为了开放网络的成长茁壮,所有媒体(包括视频),必须在无需支付编/解码器授权费的前提下使用。真正支持一个开放网络的浏览器制造商,必须努力建造一个无授权费的基本影音编/解码器。”

  微软的公司博客写道:“源代码能否取得,与知识产权之间的区别,在于可取用的源代码是极度必要的。目前,H.264的知识产权,可通过MPEG LA管理的一个定义明确的方案取得。其它编/解码器的权利通常较不清楚。”

Ogg Vorbis

Ogg 的音频编码, 质量非常优秀,特别是低码率下,支持多声道。最高码率能够达到500kbps,是 AAC 的有力竞争者。

   「Ogg」这个词汇通常意指Ogg Vorbis此一音频文件格式,也就是将Vorbis编码的音效包含在Ogg的容器中所成的格式。在以往,.ogg此一扩展名曾经被用在任何Ogg支持格 式下的内容,但在2007年,Xiph.Org基金会为了向后兼容的考虑,提出请求,将.ogg只留给Vorbis格式来使用。Xiph.Org基金会决 定创造一些新的扩展名和媒体格式来描述不同类型的内容,像是只包含音效所用的.oga,包含或不含声音的影片(涵盖 Theora)所用的.ogv和程序所用的.ogx。

  Vorbis的是一个 开源自由软件 项目负责人是 Xiph.Org基金会。该项目产生的数位音频格式规范和软件实施(编译码器)为有损音频压缩。 Vorbi是最常用的结合与Ogg容器格式,因此通常被称为 Ogg Vorbis格式.

   Vorbis是一个延续的音频压缩的开发始于 1993年克里斯蒙哥马利.集约发展始于1998年9月后,信弗劳恩霍夫协会 该公司宣布将收取许可费为 MP3音频格式。Vorbis的项目开始作为公司的一部分,Xiph.Org 基金会的Ogg项目(也称为 OggSquish多媒体项目)。克里斯蒙哥马利开始工作的项目,并协助越来越多的其它开发商。他们继续完善源代码 直到Vorbis的文件格式被冻结 2000年5月为 1.0 和一个稳定的版本(1.0)的参考软件发布于 2002年7月19日。

OggSpeex

  Ogg 的语音编码,专门针对低码率的语音编码。

Ogg FLAC

Ogg 的无损音频编码。

On2 VPX 系列

On2 公司开发了一系列优秀的视频编码,现在应用得最多的恐怕是 NullsoftVideo 的视频,它们就采用了 VP3,VP5,VP6 视频编码。

VP3

  已经作为开放源代码公布,现在 是 Ogg Theora 项目,当然,Theora 的质量可比 VP3 好多了。

VP4

  On2 公司当年吹牛全球最好的视频编码,后来证明质量很一般。

VP5

  至今还很神秘,On2 并没有放出来,只在 NullsoftVideo 里面见到他的身影。

VP6

   从一开始,On2 就把这个编码器提供给大家下载,质量还是不错的。不过最近似乎又关闭了,主页上只有一个解码器。On2 TrueMotion VP6是一个专有的有损视频编解码格式和视频编解码器。它是TrueMotion视频编解码的具体体现,是一系列由On2开发的视频编解码,通产个用于 Adobe flash,Flash Video和JavaFX媒体文件。

VP7

   On2 最新的编码器,在 VP6 上有不少进步。在2005年1月,On2宣布推出比VP6有更好的压缩比的新的编解码VP7。在2005ian4月,On2公司许可On2视频编码器9包 括VP6和VP7)用于Macromedia Flash。在2005年8月,Macromedia宣布他们选择VP6作为新的Flash Player8的视频回放的旗舰式编解码。

VP8

  Google在2009年收购了 On2 Technologies,并于2010年5月19日在Google I/O会议上宣布将VP8以BSD许可证的形式开源。。VP8是On2 Technologies继VP3之后宣布开源的第二个编解码器。(Xiph.Org 基金会于2002年接手VP3并将之冠名以Theora,之后以BSD许可证的形式将Theora开源)。要求Google将VP8开源的最大呼声来自于 自由软件基金会。2010年3月12日,自由软件基金会给Google发了一封公开信,请求Google逐渐用开源形式的VP8和HTML 5取代YouTube上的Adobe Flash和H.264。

  2010年5月19日,WebM启动。WebM包含了来自于 Mozilla、Opera、Google以及其他四十多家出版商和计算机软硬件供 应商(包括AMD、NVIDIA)的贡献,旨在大力倡导在HTML5中使用VP8。InternetExplorer 9在安装了适合的编解码器之后也能支持VP8。

注:上述材料来源于wiki的整理。

编解码学习笔记(十一):Flash Video系列

用 于在 Flash 中压缩视频。FLV流媒体格式是一种新的视频格式,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上有效使用等 缺点。一般FLV文件包在SWF PLAYER 的壳里,并且FLV可以很好的保护原始地址,不容易被下载到,从而起到保护版权的作用。

  • 文件名: .flv, .f4v, .f4p, .f4a, .f4b
  • 媒体类型:video/x-flv, video/mp4, video/x-m4v, audio/mp4a-latm, video/3gpp, video/quicktime, audio/mp4
  • 厂家:Adobe Systems (originally developed by Macromedia)
  • Type of format: Media container
  • Container for :Audio, video, text, data Extended from
  • 扩展:FLV: SWF ,F4V: MPEG-4 Part 12

Flash介绍

   Flash Video是一个文件容器格式,是Adobe Flash播放器版本6-10用于在互联网上传递视频。Flash视频内容也可以封装在SWF文件。Flash视频有两种不同的文件格式:FLV和 F4V。FLV文件中,同SWF文件一样音频和视频数据采用相同方式进行编码。晚出现的F4V,它的格式是基于ISO为基础的媒体文件格式,并在 Flash Player 9 update 3中开始得到支持。这些格式Adobe Flash播放器都能支持,并由Adobe公司开发,其中FLV最找石油Macromedia公司开发的。

  Flash视频FLV文件所包含的媒体的编码通常采用Sorenson Spark和VP6视频压缩格式。最新发布的Flash播放器支持H.264视频和HE-AAC音频。所有的这些编解码目前受到专利的限制。

   Sorenson编解码看参考以下两种专用的视频编解码:Sorenson Video或者Sorenson Spark。Sorenson Video也被称为Sorenson Codec,Sorenson Video Quantizer或者SVQ。Sorenson Spark也称为Sorenson H.263。这些编解码都是有Sorenson 媒体公司设计(及以前的Sorenson Vision公司)。Sorenson Video在Apple的QuickTime中使用,SorensonSpark在Adobe Flash(以前的MacromediaFlash)中使用。

  Flash视频通过广泛使用的Adobe Flash播放器和浏览器的plugin或者其他的第三方程序,使它能在绝大多是的操作系统都可以使用。

通 常Flash视频FLV文件包含的视频比特流是一个专有的H.263视频标准的变体,FourCC为 FLV1(Sorenson Spark)。SorensonSpark是一个FLV文件老式编解码,但被广泛应用和兼容,因此它是第一个被Flash Player支持的视频编解码。这是在Flash Player 6和7要求的视频压缩格式。Flash Player 8和更新的版本支持On2 TrueMotion VP6视频比特流回放(FourCC VP6F或者FLV4)。On2 VP6是FlashPlayer 8或者更高版本优先使用的视频压缩格式。On2 VP6可以提供能够提供比Sorenson Spark更高视觉质量,尤其在低比特流中。另外它的计算更为复杂,因此在某些古老的系统配置中无法很好使用。

   Flash 9 update 3,在2007年12月3日释放,提供了新的Flash视频文件格式F4V,支持H.264视频标准(也即MPEG-4part 10或者AVC),H.264需要更复杂的技术,但是提供更加卓著质量/比特流比例。具体而言,Flash播放器现在支持H.264视频压缩(MPEG- 4 Part 10),AAC音频压缩(MPEG-3 Part 3),F4V,MP4(MPEG-4 Part14),M4V,3GP和MOV多媒体容器格式,3GPP Timed Text标准(MEPG-4 Part 17)(这是一个标准的的字幕格式,能够部分解析ID3的’ilist’,等同于iTunes使用的metadata存储。不支持MPEG-4 Part 2视频(例如有DivX或者Xvid创建)。Jonathan Gay,一个Flash的主要程序员在接收BBC新闻采访时表示:公司最初想在Flash中使用H.264,但是被每年5百万美金(3.5百万英镑)的专 利许可费而却步。

  Flash Video FLV文件格式支持两个成为“screenshare‘(Screen Video)编解码的版本,这是一种用于桌面演示的编码格式。这两种格式都是基于tmap平铺方式,可以通过减少色深进行有损编码,并使用zlib压缩。 第二个版本之在Flash播放器8以及更新的版本支持。

  在Flash视频文件中,通常使用MP3作为音频 编码然而,在Flash视频FLV文件通过麦克风录音使用专用 的Nellymoser Asao编解码(Flash Player 10 在2008年发布,也支持开源的Speex编解码)。FLV文件支持不压缩的音频或ADPCM音频格式。最新的Flahs Player 9 支持AAC(HE-AAC/AAC SBR,AAC Main Profile,和AAC-LC)。

  编码为Flash Video文件有一个编码工具提供,包括Adobe的Flash Professional和Creative Suite产品,On2的Flix编码工具,SorensonSqueeze,FFmepg和其他第三方工具。

容器

   在2002年发布的Flash Player6增加了对SWF文件格式的支持。在2003年,FlashPlayer7增加了对FLV文件格式的直接支持。由于FLV文件格式的限 制,Adobe System公司在2007年提出下面列出的新的文件格式,是基于ISO基本媒体文件格式(MPEG-4 Part 12)。Flash播放器不检查文件的扩展名,而直接查看文件,检查属于那种格式。

文件扩展名

Mime Type

描述

.f4v

video/mp4

Video for Adobe Flash Player

.f4p

video/mp4

Protected Video for Adobe Flash Player

.f4a

video/mp4

Audio for Adobe Flash Player

.f4b

video/mp4

Audio Book for Adobe Flash Player

   在Flash Player6及以后的版本对SWF文件的支持,使得可以与Adobe Flash媒体服务器通过RTMP来进行音频,视频和数据的交互。Flash媒体服务器的数据支持采用FLV文件格式的文件(MIME类型为 video/x-flv)。从Flash Player 9 Update 3开始创建的SWF文件,Flash Player可以播发新的F4V文件格式。

媒体格式

  在FLV文件中支持的媒体类型:

  • 视频:On2 VP6,Sorneson Spark(Sorenson H.263),Screen Video,H.264
  • 音频:MP3,ADPCM,Linear PCM,Nellymoser,Speex,AAC,G.711(保留用于互通需求)

  在F4V文件中支持的媒体类型:

  • 视频:H.264
  • 图像(视频数据的静止帧):GIF,PNG,JPEG
  • 音频:AAC,HE-AAC,MP3

在Flash Player和Flash Video中支持的音视频压缩格式

Flash Player version

Released

File format

Video compression formats

Audio compression formats

6

2002

SWF

Sorenson Spark, Screen video

MP3, ADPCM, Nellymoser

7

2003

SWF, FLV

Sorenson Spark, Screen video

MP3, ADPCM, Nellymoser

8

2005

SWF, FLV

On2 VP6, Sorenson Spark, Screen video, Screen video 2

MP3, ADPCM, Nellymoser

9.0.115.0

2007

SWF, FLV

On2 VP6, Sorenson Spark, Screen video, Screen video 2, H.264[*]

MP3, ADPCM, Nellymoser, AAC[*]

   

SWF, F4V, ISO base media file format

H.264

AAC, MP3

10

2008

SWF, FLV

On2 VP6, Sorenson Spark, Screen video, Screen video 2, H.264[*]

MP3, ADPCM, Nellymoser, Speex, AAC[*]

   

SWF, F4V, ISO base media file format

H.264

AAC, MP3

[*]在FLV文件格式中使用H.264和AAC压缩有一些限制,Flash Player的作者强烈推荐大家使用新的F4V文件格式。

Flash传递的几种方式

一、作为一个标准的flv文件。

二、嵌入SWF文件,使用Flash认证工具(在FlashPlayer 6及以后的版本支持)。

三、 通过HTTP的渐进流下载(progressive download)。这种方式使用ActionScript,包括客户端侧的一个外部托管Flash Video文件用于播放。然而,和使用RTMP的媒体流不一样,HTTP“流”不支持实时广播。HTTP流要求一个定制的播放器以及包含每个关键帧精确开 始字节位置以及时间码的特定FlashVideo元数据的加入。使用这些特定的信息,定制Flash Video播放器可以要求在任何指定的关键帧中开始播放。例如,Google Video,Youtube和BitGravity支持渐进流下载,可以在缓存满之前查看视频的任何部分。在服务器侧,这种“假HTTP流“方式实现相当 简单,例如可以采用Apache的PHP模块,使用lighttpd。

四、采用RTMP协议的流,可提供的 有Flash媒体服务器(以前称为Flash Communication Server),VCS,Electro Server,Helix Universal Serval,Wowza Pro,用于.NET的WebORB,用于Java的WebORB,以及开源的Red5服务器。在2008年4月,这个协议有流录像提供,不需要重新编码 的screencast软件。

  RTMP,实时消息协议,Real Time Message Protocol是一个有Adobe System为在互联网的音频,视频和数据流开发的私有协议,运行在Flash播放器和服务器之间。RTMP协议有三个方式:
1、 通过在TCP上,使用1935端口的“纯”协议。
2、 用于在穿越防火墙时,在HTTP请求中封装的RTMPT。
3、 在HTTPS的安全连接中使用的RTPMS。

注:上述材料来源于wiki的整理。

编解码学习笔记(十二):其他编解码

M-JPEG

   M-JPEG(Motion-JoinPhotographicExpertsGroup)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编 辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每 一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。

   同样格式的MPEG视 频压缩不同于帧间压缩,因为压缩比特率比较低,所以编码与 解码相对比较容易,并不需要过多的运算能力,也使得软件或者芯片可以十分容易地对Motion JPEG进行编辑。也因为此,一些移动设备,如数码相机使用MotionJPEG来进行短片的编码。

Motion JPEG 2000

   JPEG2000是基于小波变换的图像压缩标准,由Joint PhotographicExperts Group组织创建和维护。JPEG2000通常被认为是未来取代JPEG(基于离散余弦变换)的下一代图像压缩标准。JPEG2000文件的副档名通常 为.jp2,MIME类型是image/jp2。

  虽然JPEG2000在技术上有一定的优势,但是到目前为 止(2006年),互联网上采用JPEG2000技术 制作的图像文件数量仍然很少,并且大多数的浏览器仍然没有缺省支持JPEG2000图像文件的显示。但是,由于 JPEG2000在无损压缩下仍然能有比较好的压缩率,所以JPEG2000在图像品质要求比较高的医学图像的分析和处理中已经有了一定程度的广泛应用。

DivX

  • 文件名扩展: .divx
  • 类型:DIVX
  • 开发者: DivX,Inc
  • 格式类型:媒体容器,用于MPEG-4 Part 2–compliant video
  • 扩展来源:AVI

   这是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即通常所说的DVDrip格式,它采用了MPEG4 的压缩算法同时又综合了MPEG-4 与MP3各方面的技术,说白了就是使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,然后再将视频与音频 合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD并且体积只有DVD的数分之一。这种编码对机器的要求也不高,所以DivX视频编码技术 可以说是一种对DVD造成威胁最大的新生视频压缩格式,号称DVD杀手或DVD终结者。

  DivX,是DivX公司(前身是DivXNetworks公司)的著名品牌,是一种MPEG-4技术视频编译码器(codec),2007年秋以2200万美元收购德国MainConcept。

   ISO公布了“超低比特率活动图像和语音压缩标准 ”,排序MPEG-4,1998年10月批准第一版,1994年4月又公布了第二版及其校验模型(VM),MPEG-4正式编号是ISO/IEC国际标准 14496,它是一种新型的多媒体标准,它与前标准一个重要区别就在于,是一个基于对象的视编码压缩标准,所定义的码率控制的目标就是获得在给定码率下的 最优质量,它为互联网上传输高质量的多媒体视频提供了很好的技术平台。

  1998年微软开发了第一个在PC上 使用的MPEG-4编码器,它包括MS MPEG4V1、MSMPEG4V2、MS MPEG4V3的系列编码内码,其中V1和V2用来制作AVI文件,一直到现在它都是作为Windows的默认组件,不过V1和V2的编码质量不是很好, 一直到MS MPEG4V3才开始有好转,画质有了显着的进步,但是不知微软出于什么目的,却将这个MS MPEGV3的视频编码内核封闭,仅仅使其应用于Windows Media流媒体技术上,也就是我们熟悉的ASF流媒体文件中。ASF文件虽然有一些优势,但是由于过分的封闭不能被编辑,末得到广泛应用,这便惹怒了那 些个不怕天不怕地的视频黑客和致力于钻研视频编码的高手,后来,这些小组不仅破解了微软的视频编码,而且经过他们的修改,一种新的视频编码诞生了:那就是 广为流传的MPEG编码器-DivX3.11。

  DivX采用了MS的MPEGV3,改良后并加入自己功 能称之为DivX3.11,也是目前互联网上普通采用的 MPEG-4编码器之一。很快,DivX被传得红得发紫,几乎成了业界的标准,但是,同样很快地出现了,DivX的基础技术是非法盗用微软的,微软声称将 对所有推动DivX发展的人、企业进行追究,可是DivX技术的创造者之一罗达(Rota)正全面申请将DivX合法化,这是基于DivX虽然是从 Window的发明出来的,但却没有用过任何微软的技术,更组建新公司DivXNetworks全力推广DivX,看来DivX(俗称压缩电影)蓬勃发展 的大潮是势不可挡了。

  看来任何吸引眼球的故事在关键时刻都会发生转折,DivX的发展竟也不能脱离这一 俗套,就在DivX顺利发展时 期,DivX的技术逐渐成熟,商机无限的时候,一台好戏上演了,DivXNetworks成立初衷就是摆脱微软的技术封闭,因而发起一个完全开放源码的项 目,名为 “ Projet Mayo ”,目标是开发一套全新的、开放源码的MPEG4编码软件,由于它完全符合ISO MPEG标准,又是完全开放源代码,OpenDivXCODEC吸引了 很多软件,视频高手参与,很快便开发出具有更高性能的编码器Encore2等等,就在DivX最辉煌的时期,DXN公司突然封闭了DivX的源代码,并在 Encore2的基础上发布了自有产品DivX4,原来DXN早就给自己留了后门,DivX采取的是LGPL协议,而不是GPL协议,虽说它们都是公共许 可证协议,保障自由使用和修改软件或源码的权利,但LGPL允许私有,DXN就是利用这一协议初其不备的耍出了大刀。

  接着,很多被DXN公司狠狠涮了一回的软件、视频团体另起门户,逐渐重新聚拢开发力量,高举复仇大旗,在OpenDivX版本基础上,再次开发出一种新的MPEG-4编码--XviD,名字的顺序和DviX刚好相反,仅仅从名字就可以看出Xvid充满了复仇的力量。

   DivX是近一两年来称霸网络视频的图像压缩编码标准。起初它是以微软MPEG 4视频编码标准为基础修改和开发的,并以免费方式发布。其特点是具有十分不错的压缩比率,可以将一整套DVD质量的影片压缩存放到一张CD-R光盘中。现 在的DivX分为普通版和Pro版,其中后者还有收费版和Adware(广告)版两种,自带DivX Player程序进行播放。用户如果安装了免费的DivX Codec后,也可用Windows Media player观看DivX影片。

注:上述材料来源于wiki的整理。

编解码学习笔记(十三):容器(上篇)

视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。

   FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来 编码的。因此wav、avi大量存在等于“IDP3”的FourCC。

ISO/IEC

MPEG-PS · MPEG-TS · MPEG-4 Part 12 /JPEG 2000 Part 12 · MPEG-4 Part 14

ITU-T

H.222.0

Others

3GP and 3G2 · ASF · AVI · Bink · DivX Media Format · DPX · EVO · Flash Video · GXF · M2TS · Matroska· MXF · Ogg · QuickTime File Format · RealMedia · REDCODE RAW · RIFF · Smacker · MOD and TOD · VOB · WebM

Audio Only

AIFF · AU · WAV

3GP和3G2容器  

   3GP(3GPP文件格式)是一个多媒体容器由第三代合作伙伴计划(3GPP)针对3G UMTS多媒体服务定义。它用于3G移动电话,但也可以用于某些2G和4G的电话。3GP在ETSI 3GPP技术规范中定义,他是视频文件格式,并带有讲话/音频媒体类型和带时间信息的文本,用于IMS,MMS,多媒体广播/多播服务(MBMS)和传输 端到端的包交换流媒体服务(PSS)。

  3G2(3GPP2文件格式)是一个多媒体容器有3GPP2为3G CDMA 2000多媒体服务定义。她与3GP文件格式非常相似,但与之相比存在一些扩展和限制。3G2在3GPP2技术规范中定义。

   3GP和3G2文件格式都是基于在ISO/IEC 14496-12(MPEG-4 Part 12)定义的ISO基础媒体文件格式,但是老板不的3GP文件格式不具有其中某些属性。3GP和3G2与MP4(MPEG-4 Part 14)相似,MP4也是基于MPEP-4 Part 12。3GP和3G2设计目的是为移动电话减少存储和带宽要求,它们是非常相似的标准,但有区别:

  • 3GPP 文件格式用于GSM类电话,文件扩展名:.3gp
  • 3GPP2文件格式用于CDMA类电话,并具有文件扩展名:.3g2

   3GP文件存贮视频流:MPEG-4 Part2,H.263,MPEG-4 Part 10(AVC/H.264),音频流 AMR-NB, AMR-WB, AMR-WB+,AAC-LC, HE-AAC v1 和 Enhanced aacPlus (HE-AAC v2)。3GPP允许ISO基础文件格式(MPEG-4Part12)中使用AMR和H.263编解码,因为3GPP在ISO基础文件格式中规定了采样条 目和模板字段的使用,可以为编解码定义新的box。这些 扩展在ISO基础媒体文家格式(“MP4家族”文件)中由登记授权登记为code-point。对于在3GP文件中存贮MPEG-4媒体,3GP规定参加 了MP4和AVC文件格式规范,它们也是基于ISO基础媒体文件格式。MP4和AVC文件格式规范描述在ISO基础媒体文件格式中使用MPEG-4内容。 有些手机使用.mp4作为3GP视频的扩展。

  3G2文件格式可以存贮与3GP文件格式相同的视频流和觉 得部分的音频流。此外3G2可以存在音频流还包括 EVRC,EVRC-B,EVRC- WB,13K(QCELP),SMV,和VMR-WR。3G2规范还定义了在3GPP带时间文件的某些货站。3G2文件格式不支持Enhanced aacPlus (HE-AAC v2) 和AMR-WB+ audiostreams。对于在3G2文件中存在MPEG-4媒体(AAC音频,MPEG-4 Part 2音频,MPEG-4 Part 10/H.264/AVC),3G2规范提及了MP4 文件格式和AVC文件格式规范,在那里描述了如果在ISO基础媒体文件格式中使用这些内容。对于在3G2中存储H.263和AMR内容,3G2规范参见了 3GP文件格式规范。

  3GP格式视频有两种分辨率:

  • 分辨率176×144,适合市面上所有支持3GP格式的手机。
  • 分辨率320×240,清晰,适合高档手机、MP4播放器、PSP以及苹果iPod.

ANIM

  ANIM标准的多媒体文件用于经典的Commodore Amiga的数字动画。它遵循IFF ILBM主规范,他是第一个动画格式被操作系统正式采纳。

ASF

  微软WMA和WMV的标准容器。

  WMV(Windows Media Video)是微软公司开发的一组数字视频编解码格式的通称,ASF(Advanced Systems Format)是其封装格式。ASF封装的WMV档具有"数字版权保护"功能。扩展名:wmv/asf、wmvhd。

   ASF (Advanced Streaming format高级流格式)。ASF 是 MICROSOFT为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了 MPEG4 的压缩算法,压缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频"流"格式存在的,所以它的图像质量比 VCD 差一点点并不出奇,但比同是视频"流"格式的 RAM 格式要好。

  • 文件扩展名 :.asf .wma .wmv
  • 互联网媒体类型: video/x-ms-asf, application/vnd.ms-asf
  • 类型码 : 'ASF_'
  • 唯一类型码 :Identifier com.microsoft.advanced-systems-format
  • Magic number :30 26 b2 75
  • 开发者 :Microsoft
  • 格式类型 :Container format
  • 容器容纳 :WMA, WMV, MPEG4 etc.

AVI

   AVI (the standard Microsoft Windows container, also based on RIFF)。AVI是英语Audio Video Interleave("音频视频交织"或译为"音频视频交错")的首字母缩写,由微软在 1992年11月推出的一种多媒体文件格式,用于对抗苹果Quicktime的技术。现在所说的AVI多是指一种封装格式。

   比较早的AVI是Microsoft开发的。其含义是Audio Video Interactive,就是把视频和音频编码混合在一起存储。AVI也是最长寿的格式,已存在10余年了,虽然发布过改版(V2.0于1996年发 布),但已显老态。AVI格式上限制比较多,只能有一个视频轨道和一个音频轨道(现在有非标准插件可加入最多两个音频轨道),还可以有一些附加轨道,如文 字等。AVI格式不提供任何控制功能。扩展名:avi。

  AVI能使用的编码:

  • 视频名称(括号内表示的是此视频的FourCC)
    o MPEG-1/-2 (MPEG/MPG1/MPG2)
    o MPEG-4 (MP4V/XVID/DX50/DIVX/DIV5/3IVX/3IV2/RMP4)
    o MS-MPEG4 (MPG4/MP42/MP43)
    o WMV7/WMV8/WMV9 (WMV1/WMV2/WMV3)
    o DV(DVSD/DVIS)
    o Flash Video (FLV1/FLV4)
    o Motion JPEG (MJPG)
    o LossLess JPEG (LJPG)
    o H.264 (AVC1/DAVC/H264/X264)
    o H.263 (H263/S263)
    o H.261 (H261)
    o Huffyuv (HFYU)
    o AVIzlib (ZLIB)
    o AVImszh (MSZH)
    o Theora (THEO)
    o Indeo Video (IV31/IV32)
    o Cinepak (cvid)
    o Microsoft Video 1 (CRAM)
    o On2VP3 (VP30/VP31)
    o On2VP4 (VP40)
    o On2 VP6 (VP60/VP61/VP62)
    o VC-1 (WVC1)
  • 音频
    o PCM
    o MP3 (0x0055)
    o AC-3 (0x0092)
    o AAC
      - HE-AAC
      - LC-AAC
    o FLAC
    o Indeo Audio
    o TrueSpeech
    o WMA
    o Vorbis

  编码组合能根据以下的例子自由选择。

  • (DivX或XviD+MP3).avi,
  • (H.264+MP3).avi
  • (WMV9+MP3).avi

  以XviD+MP3构成的AVI最为常见。

DVB-MS

   DVR-MS (Microsoft Digital Video Recording,微软数字视频录制)是一种专用的视频和音频文件容器格式,有微软开发,用于存储由Windows XPMedia Center Edition,Windows Vista和Windows 7录制的电视内容。多个数据流(视频和音频)在带有DVR-MS扩展的ASF容器中封装。视频使用MPEG-2标准编码,音频使用MPEG-1 Layer II或者杜比数字AC-3(ATSC A/52)。扩展的格式包括内容和数字版权管理的元数据。这些格式的文件有流缓存引擎(SBE.dll)生成,这是一个在Windows XP Service Pack 1的DirectShow组件。

MPEG/MPG/DAT

   MPEG格 式:MPEG(Moving Picture Experts Group),是一个国际标准组织(ISO)认可的媒体封装形式,受到大部份机器的支持。其存储方式多样,可以适应不同的应用环境。MPEG-4档的档容 器格式在Part 1(mux)、14(asp)、15(avc)等中规定。MPEG的控制功能丰富,可以有多个视频(即角度)、音轨、字幕(位图字幕)等等。MPEG的一 个简化版本3GP还广泛的用于准3G手机上。扩展名:dat(用于VCD)、vob、mpg/mpeg、3gp/3g2(用于手机)等。

   MPEG也是Motion Picture Experts Group 的缩写。这类格式包括了 MPEG-1, MPEG-2 和 MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的( 刻录软件自动将MPEG1转为 .DAT格式 ) ,使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小。MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2的图像质量MPEG-1 与其无法比拟的)。

  MPEG-PS:MPEG节目流(programstream),是MPEG-1和MPEG-2基准流的标准容器,用于在可靠介质上,例如磁盘,也用于DVD-Video光碟。

  MPEG-TS:MPEG传输流,是数字广播和在非可靠媒体传输的标砖容器,也在蓝光光碟使用,通常携带多个视频和音频流以及一个电子节目指南。

n AVI

   如果你发现原来的播放软件突然打不开此类格式的AVI文件,那你就要考虑是不是碰到了n AVI。n AVI是 New AVI 的缩写,是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由MicrosoftASF 压缩算法的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图像质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率。可以这样说,NAVI 是一种去掉视频流特性的改良型 ASF 格式。

注:上述材料来源于wiki的整理。

编解码学习笔记(十四):容器(下篇)

Matroska(MKV)

  MKV ,不是任何的编解码或者系统的标准,但实际上可封装任何的东西。是一个开放以及开源的容器格式。

扩展名      .mkv .mka .mks
互联网媒体类型  video/x-matroska audio/x-matroska 开
发者       Matroska.org
格式       视频文件格式
专门属      多媒体
自由文件格式?  Yes: GNU LGPL

   Matroska,很多人把它当作为MKV,其实MKV只 是Matroska媒体系列的其中一种文件。Matroska是一种新的多媒体封装格式,这个封装格式可把多种不同编码的视频及16条或以上不同格式的音 频和语言不同的字幕封装到一个Matroska Media档内。它也是其中一种开放源代码的多媒体封装格式。

  多媒体封装格式,简称MCF、多媒体容器,是一个开放(没有身份规限,免费)及自由把数据存放的格式。开发者承诺大家可以自 由地使用这种格式和经这种格式所开发的软件;又不会在这种格式普遍的时候变成一个商业的科研项目。

Matroska媒体定义了三种类型的档:

  • MKV (Matroska Video File) :视频档,可以包含音频和字幕;
  • MKA (Matroska Audio File) :单一的音频档,可以有多条及多种类型的音轨;
  • MKS (Matroska Subtitles) :字幕文件。

  这三种文件中以MKV最为常见。

  Matroska最大的特点就是能容纳多种不同类型的视频编码、音频编码及字幕流,并且它能把非常高密的RealMedia及QuickTime文 件也容纳在内,同时将它们的音频和视频重新组织起来,从而达到一个更好和鲜明的效果。

  Matroska的开发是对多种传统媒体格式的一次大挑战,虽则如此,Matroska也被开发成一个多功能的多媒体容器。

MP4

   MP4,是MPEG-4定义的标准音视频容器,基于ISO基础媒体文件格式(在MPEG-4 Part 12以及JPEG 2000 Part 12中定义),在MPEG-4 Part 14中描述。是一种使用MPEG-4的多媒体电脑档案格式,副档名为.mp4,以储存数码音讯及数码视讯为主。

扩展名     .mp4
互联网媒体类型 video/mp4, audio/mp4, application/mp4
类型代码    mpg4
开发者     ISO
格式      视频文件格式
专门属     Audio, video, text
延伸自     QuickTime .mov and MPEG-4 Part 12
标准      ISO/IEC 14496-14

MOD

  MOD格式是JVC生产的 硬盘摄录机所采用的存储格式名称。

MOV

   MOV是评估公司的标准QuickTime视频容器。QuickTime Movie是由苹果公司 开发的容器,由于苹果电脑在专业图形领域的统治地位,QuickTime格式格式基本上成为电影制作行业的通用格式。1998年2月11 日,国际标准组织(ISO)认可QuickTime文件格式作为MPEG-4标准的基础。QT可存储的内容相当丰富,除了视频、音频以外还可支持图片、文 字(文本字幕)等。扩展名:mov

  使用过Mac机的朋友应该多少接触过QuickTime。 QuickTime原本是Apple公司用于Mac计 算机上的一种图像视频处理软件。 Quick-Time提供了两种标准图像和数字视频格式 , 即可以支持静态的PIC和JPG图像格式,动态的基于Indeo压缩法的MOV和基于MPEG压缩法的MPG视频格式。

Ogg

   Ogg是Xiph.org音频编解码Vorbis和视频编解码Theora的标砖容器,Ogg Media一个完全开放性的多媒体系统计划,OGM(Ogg Media File)是其容器格式。OGM可以支持多视频、音频、字幕(文本字幕)等多种轨道。扩展名:ogg。

OGM

  OGM(Ogg Media),是Xiph.ofg的视频编解码容器,已经不再支持,并不鼓励使用。

RealMedia

   RealMedia是RealVideo和RealAudio的标准容器。Real Video或者称Real Media(RM)档是由RealNetworks开发的一种档容器。它通常只能容纳Real Video和Real Audio编码的媒体。该档带有一定的交互功能,允许编写脚本以控制播放。RM,尤其是可变比特率的RMVB格式,体积很小,非常受到网络下载者的欢迎。 扩展名:rm/rmvb

 RM

   Real Networks公司所制定的音频/视频压缩规范Real Media中的一种,Real Player能做的就是利用Internet资源对这些符合Real Media技术规范的音频/视频进行实况转播。在Real Media规范中主要包括三类文件:RealAudio、Real Video和Real Flash (Real Networks公司与Macromedia公司合作推出的新一代高压缩比动画格式)。REAL VIDEO (RA、RAM)格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者。它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放,可是其图像质量比VCD差些,如果您看过那些RM压缩的影碟就可以明显对比出来了。

 RMVB

   这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均 压缩采样的方式,在保证平均压缩比的 基础上合理利用比特率资源,就是说静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时 被利用。这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。另外,相对于DVDrip 格式,RMVB视频也是有着较明显的优势,一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式,其个头最多也就400MB 左右。不仅如此,这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。要想播放这种视频格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器形式进行播放。

VOB

   VOB文件(video Object)是一个DVD视频媒体的容器格式。VOB可以包含视频,音频,字母和菜单整合在一个流格式中。VOB是基于MPEG PS格式,但是有额外的限制和私有流的规范。MPEG PS提供非标准数据称为私有流。VOB文件是MEPG PS表站中非常严格的子集。经所有的VOB文件都是MPEG PS,但不是所有的MPEG PS都遵守VOB文件的定义。

   与MPEG的PS相似,VOB文件可以包含H.262/MPEG-2 Part2或者MPEG-1 Part 2视频,MPEG-1 Audio LayerII或者MOEG-2 Audio Layer II音频,但是和MPEG PS相比,在VOB文件中使用这些压缩格式有某些限制。此外,VOB可以包括线性PCM,AC-3或者DTS视频以及字母。VOB文件不能包含AAC音频 (MPEG-2 Part 7),MPEG-4压缩格式或者其他,而这些在MPEG PS标准中是允许的。

  文件扩展名 .VOB
  开发者:  DVD Forum
  类型:   媒体容器
  包含:   音频,视频,字母
  用于:   DVD-Video
  从何扩展: MPEG program stream, ISO/IEC 13818-1
  标准规范: DVD-Video Book

注:上述材料来源于wiki的整理。

阅读更多
换一批

没有更多推荐了,返回首页