图象压缩技术


MPEG-1
MPEG视频 压缩编码后包括三种元素:I帧(I-frames)、P帧(P-frames)和B帧(B-frames)。在MPEG编码的过程中,部分视频 帧序列压缩成为I帧;部分压缩成P帧;还有部分压缩成B帧。I帧法是 帧内压缩法,也称为“ 关键帧”压缩法。I帧法是基于 离散余弦变换DCT( Discrete Cosine Transform )的 压缩技术,这种算法与JPEG压缩算法类似。采用I帧压缩可达到1/6的 压缩比而无明显的压缩痕迹。

在保证图像质量的前提下实现高压缩的压缩算法,仅靠 帧内压缩是不能实现的,MPEG采用了帧间和帧内相结合的压缩算法。 P帧法是一种前向预测算法,它考虑相邻帧之间的相同信息或数据,也即考虑运动的特性进行 帧间压缩。P帧法是根据本帧与相邻的前一帧(I帧或P帧)的不同点来压缩本帧数据。采取P帧和I帧联合压缩的方法可达到更高的压缩且无明显的压缩痕迹。

然而,只有采用B帧压缩才能达到200:1的高压缩。B帧法是双向预测的 帧间压缩算法。当把一帧压缩成B帧时,它根据相邻的前一帧、本帧以及后一帧数据的不同点来压缩本帧,也即仅记录本帧与前后帧的差值。B帧数据只有I帧数据的百分之十五、P帧数据的百分之五十以下。

MPEG标准采用类似4:2:2的采用格式,压缩后亮度信号的分辨率为352×240,两个 色度信号分辨率均为176×120,这两种不同分辨率信息的 帧率都是每秒30帧。其编码的基本方法是在单位时间内,首先采集并压缩第一帧的图像为I帧。然后对于其后的各帧,在对 单帧图像进行有效压缩的基础上,只存储其相对于前后帧发生变化的部分。 帧间压缩的过程中也常间隔采用 帧内压缩法,由于帧内( 关键帧)的压缩不基于前一帧,一般每隔15帧设一 关键帧,这样可以减少相关前一帧压缩的误差积累。MPEG 编码器首先要决定压缩当前帧为I帧或P帧或B帧,然后采用相应的算法对其进行压缩。一个视频 序列经MPEG全编码压缩后可能的格式为:IBBPBBPBBPBBPBBIBBPBBPBBPBBPBBI......

压缩成B帧或P帧要比压缩成I帧需要多得多的计算处理时间。有的 编码器不具备B帧甚至P帧的压缩功能,显然其压缩效果不会很好。
MPEG-2
MPEG组织在1994年推出 MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。 MPEG-2标准是针对标准 数字电视高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码 码率从每秒3 兆比特~100 兆比特,标准的 正式规范在ISO/IEC13818中。MPEG-2不是 MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于 广播级数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。MPEG-2还专门规定了多路节目的复分接方式。MPEG-2标准目前分为9个部分,统称为ISO/IEC13818国际标准。

MPEG-2 图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。一帧图像内的任何一个场景都是由若干像素点构成的,因此一个像素通常与它周围的某些像素在亮度和 色度上存在一定的关系,这种关系叫作空间相关性;一个节目中的一个情节常常由若干帧连续图像组成的 图像序列构成,一个 图像序列中前后帧图像间也存在一定的关系,这种关系叫作时间相关性。这两种相关性使得图像中存在大量的 冗余信息。如果我们能将这些 冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输 频带。而 接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的 冗余信息

MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。

I帧图像采用帧内 编码方式,即只利用了 单帧图像内的空间相关性,而没有利用时间相关性。I帧使用帧内压缩,不使用 运动补偿,由于I帧不依赖其它帧,所以是 随机存取的入点,同时是解码的基准帧。I帧主要用于 接收机的初始化和 信道的获取,以及节目的切换和插入,I帧图像的压缩倍数相对较低。I帧图像是周期性出现在 图像序列中的,出现频率可由 编码器选择。

P帧和B帧图像采用帧间 编码方式,即同时利用了 空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码 码流图像帧的传输顺序和显示顺序是不同的。

P帧和B帧图像采用帧间 编码方式,即同时利用了 空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码 码流图像帧的传输顺序和显示顺序是不同的。

MPEG-2的编码 码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。

MPEG-4
MPEG-4于1998年11月公布, MPEG-4是针对一定 比特率下的视频 、 音频编码,更加注重 多媒体系统交互性和灵活性。MPEG-4标准力求做到两个目标:低 比特率下的 多媒体通信;是多工业的 多媒体通信的综合。为此,MPEG-4引入了AV对象(Audio/Visual Objects),使得更多的交互操作成为可能:
"AV对象"可以是一个孤立的人,也可以是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。

MPEG-4对AV对象的操作主要有:采用AV对象来表示听觉、视觉或者视听组合内容;组合已有的AV对象来生成复合的AV对象,并由此生成AV场景;对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据;允许接收端的用户在AV场景中对AV对象进行交互操作等。
MPEG-4标准则由6个主要部分构成:
① DMIF(The Dellivery Multimedia Integration Framework)
DMIF 即 多媒体传送整体框架,它主要解决 交互网络中、广播环境下以及磁盘应用中 多媒体应用的操作问题。 通过传输多路合成比特信息来建立客户端和服务器端的交互和传输。 通过DMIF,MPEG4可以建立起具有特殊 品质服务(QoS)的 信道和面向每个基本流的带宽。
② 数据平面
MPEG4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。
为了使基本流和AV对象在同一场景中出现,MPEG4引用了对象描述(OD)和流图桌面(SMT) 的概念。OD 传输与特殊AV对象相关的基本流的 信息流图。桌面把每一个流与一个CAT(Channel Assosiation Tag)相连,CAT可实现该流的顺利传输。
缓冲区管理和实时识别
MPEG4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理 比特流句法 语义的解码装置,它要求特殊的 缓冲区实时模式。通过有效地管理,可以更好地利用有限的 缓冲区空间。
音频编码
MPEG4的优越之处在于--它不仅支持自然声音,而且支持合成声音。MPEG4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
⑤ 视频 编码
音频编码类似,MPEG4也支持对自然和合成的视觉对象的编码。 合成的视觉对象包括2D、3D 动画和人面部表 情动画等。
⑥ 场景描述
MPEG4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述,这些场景描述以 二进制格式BIFS(Binary Format for Scene description)表示,BIFS与AV对象一同传输、编码。场景描述主要用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。同时还有AV对象与AV场景的 知识产权保护等问题。MPEG4为我们提供了丰富的AV场景。
与MPEG-1和MPEG-2相比,MPEG-4更适于交互AV服务以及 远程监控,它的设计目标使其具有更广的适应性和 可扩展性: MPEG-4 传输速率在4800-64000bps之间,分辨率为176×144,可以利用很窄的带宽通过帧重建技术压缩和传输数据,从而能以最少的数据获得最佳的图像质量。因此,它将在 数字电视动态图像、 互联网、实时 多媒体监控、移动 多媒体通信、Internet/Intranet上的视频 流与可视游戏、DVD上的交互多媒体应用等方面大显身手。

H.264
H.264是ITU-T的VCEG(视频 编码专家组)和ISO/IEC的MPEG(活动 图像编码专家组)的联合视频 组(JVT:joint video team)开发的一个新的 数字视频 编码标准,它既是ITU-T的 H.264,又是ISO/IEC的 MPEG-4的第10 部分。1998年1月份开始 草案征集,1 999年9月,完成第一个 草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。目前该标准还在开发之中,预计明年上半年可正式通过。

H.264和以前的标准一样,也是DPCM加 变换编码混合编码模式。但它采用“ 回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种 信道的适应能力,采用“网络友好”的结构和语法,有利于对 误码丢包的处理;应用目标范围较宽,以满足不同速率、不同 解析度以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。

H.264的算法在概念上可以分为两层:视频 编码层(VCL:Video Coding Layer)负责高效的视频 内容表示,网络提取层(NAL:Network Abstraction Layer)负责以网络所要求的恰当的方式对数据进行打包和传送。 H.264支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6 抽头 滤波器来减少高频噪声,对于1/8像素精度的运动矢量,可使用更为复杂的8 抽头滤波器。在进行 运动估计时,编码器还可选择“增强”内插 滤波器来提高预测的效果。H.264中 熵编码有两种方法,一种是对所有的待编码的符号采用统一的VLC(UVLC :Universal VLC),另一种是采用内容 自适应二进制 算术编码。H.264 草案中包含了用于差错消除的工具,便于压缩视频 在 误码丢包多发环境中传输,如移动信道或IP信道中传输的健壮性。

在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、 多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得 H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的 码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。

H.264具有广阔的应用前景,例如实时视频 通信、 因特网视频 传输、视频 流媒体服务、异构网上的多点通信、压缩视频 存储、视频 数据库等。H.264优越性能的获得不是没有代价的,其代价是计算 复杂度的大大增加,据估计,编码的计算 复杂度大约相当于H.263的3倍,解码 复杂度大约相当于H.263的2倍。

H.264建议的技术特点可以归纳为三个方面,一是注重实用,采用成熟的技术,追求更高的编码效率,简洁的表现形式;二是注重对移动和 IP网络的适应,采用分层技术,从形式上将编码和信道隔离开来,实质上是在源编码器算法中更多地考虑到信道的特点;三是在 混合编码器的基本框架下,对其主要 关键部件都做了重大改进,如 多模运动估计帧内预测、多帧预测、统一VLC、4×4二维整数变换等。

迄今为止,H.264尚未最后定稿,但因其更高的 压缩比,更好的信道适应性,必将在 数字视频 的通信或存储领域得到越来越广泛的应用,其发展潜力不可限量。

欢迎了解采用最新H.264压缩算法的 硬盘录像机http://www.21yh.net/cpzs-n.asp?id=20
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值