多媒体数据压缩编码基础(第七章)

前言

        这一章重中之重,考试出的太多了大家可没事的时候一定好好看,废话不多说,上干货!

一、多媒体数据压缩的必要性与可能性

  1. 必要性:大数据量的图像信息会给存储器的存储容量、通信线路的带宽以及计算机的处理速度增加极大压力。如果没有多媒体编码压缩技术的发展,大容量图像、视频信息的存储和传输就难以实现。

  2. 可能性:视频由一帧帧图像组成,图像的各像素之间存在一定的相关性,即冗余度。通过某种编码方法提取或减少冗余度可实现压缩数据的目的。

    • 空间冗余:静态图像存在的最重要的一种数据冗余。同一景物表面上各采样点的颜色之间存在空间连贯性。
    • 时间冗余:相邻帧记录相邻时刻的同一场景画面。
    • 结构冗余:图像的部分区域内存在较强的纹理结构或具有规则形状,或图像各部分存在强相似性。(例:电视画面中大部分区域信号变换缓慢)
    • 知识冗余:图像的理解与某些知识有很大相关性。知识冗余是模型编码主要利用的特征。
    • 视觉冗余:人眼对一般图像中的许多信息并不敏感。
    • 图像区域的相同性冗余:图像中两个或多个区域对应的所有像素值相同或相近产生的数据重复性存储。
    • 纹理的统计冗余:有些图像纹理尽管不严格服从某一分布规律,但在统计的意义上服从该规律。

二、压缩编码基础理论

信息论是研究编解码的理论基础,信息论认为:如果信源编码的熵大于信源的实际熵,则该信源中一定存在冗余。去掉冗余不会减少信息量,仍可原样恢复数据。但如果减少了熵,数据则不能完全恢复。不过,在允许的范围内损失一定的熵,数据仍可近似恢复,得到的信息仍可以接受。

三、编码压缩方法分类

根据重建图像与原始图像是否有误差,分为:

  1. 无损编码:仅删除数据中的冗余信息,解压缩后能精确恢复原始图像。
  2. 有损编码:以放弃部分信息量为代价换取缩短平均码长的编码压缩方法。
  3. 根据编码原理,分为:
    • 熵编码:基于信号统计特性的编码技术,属于无损编码。包括:霍夫曼编码,算术编码,行程编码。
    • 预测编码:基于图像数据的空间或时间冗余特性,用相邻的已知像素预测当前像素的取值,再对预测误差进行量化和编码。属于有损编码。包括:差分脉冲编码调制和运动补偿法。
    • 变换编码:将空间域上的图像经正交变换映射到另一变换域上,使变换后的系数之间相关性降低。属于有损编码。包括:小波变换。
    • 混合编码:综合了熵编码 + 预测编码 + 变换编码,如 JPEG 标准,MPEG 标准。

四、统计编码

统计编码属于无损编码,根据消息出现的概率的分布特性而进行的压缩编码。包括:香农 - 费诺编码,霍夫曼编码,算术编码,行程(RLE)编码,字典编码。

  1. 香农 - 费诺编码:目的是产生具有最小冗余的码词。
  2. 霍夫曼编码:用变长的码字使冗余量达到最小,出现频率越高的像素值,编码长度越短,用尽可能少的代码表达信源数据。变长编码中最佳方法。
  3. 算术编码:将编码的信息表示为实数 0 和 1 之间的一个间隔,消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。
  4. 游程 / 行程编码:利用空间冗余度压缩图像。适用于灰度等级少,灰度值变化小的二值图像。主要应用于 ITU 为传真制定的文件传真三类机 G3 的一维标准中。
  5. RLE 编码:假设一个图像的像素色彩值是这样排列的:红红红红红红红红红红红红蓝蓝蓝蓝蓝蓝绿绿绿绿,经过 RLE 压缩后就成为了:红 12 蓝 6 绿 4。这样既保证了压缩的可行性,而且不会有损失。
  6. 字典编码:用符号代替一串字符,字符可以是有意义的,也可以是无意义的。

五、预测编码

  1. 无损预测编码:直接对差值信号进行编码。
  2. 有损预测编码:对差值信号进行量化后再进行编码。如:差分脉冲编码调制 DPCM。

预测编码:二维图像相邻像素间存在相关性,利用相关性,每个像素的值可以根据其临近的前几个像素的值进行预测,预测值和实际值相减得到误差值,对误差值进行编码以得到预测编码结果。

六、变换编码

  1. 小波变换:用一族函数表示或逼近信号。在静态和动态图像压缩领域得到广泛应用,成为 MPEG - 4 等国际标准的重要环节。
  2. 变换编码:将空间域上的图像经正交变换映射到另一变换域上,使变换后的系数之间相关性降低,然后对变换系数进行编码处理。

变换编码的特点

  1. 可得到高的压缩比。
  2. 比预测编码等其他方法的计算复杂度更高。

正交变换包括:傅里叶变换,沃尔什变换,离散余弦变换(复杂度适中,可分离特性,快速算法),K - L 变换(最佳正交变换,是消除相关性最好的算法。但计算复杂)。

七、其他编码

其他编码:均属于有损压缩。包括:矢量量化编码,子带编码。

八、视频编码

视频的预测编码:包括帧内预测编码(在一副图像内进行预测)和帧间预测编码(利用视频图像帧间的相关性,即时间相关性获得比帧内编码高得多的压缩比)。

九、数据压缩编码标准

  1. 静态图像压缩编码标准

    • JPEG 标准:适用于不太复杂或取自真实景象的图像压缩,使用了离散余弦变换(为主),量化,行程编码,霍夫曼编码技术,是混合编码。对一般图像采用 20:1 或 25:1 比率压缩。无损模式的压缩比采用 2:1。
      • 正向离散余弦变换 (FDCT):先按序分块,将图像分为 8×8 的图像子块,对每一个子块进行 DCT 变换,得到 DCT 系数矩阵。
      • 量化:DCT 系统矩阵量化后提高了压缩率。
      • 使用差分脉冲调制 (DPCM) 对直流系数 DC 进行编码。
      • 使用行程长度编码 (RLE) 对交流系数 AC 进行编码:共使用 2 个字节表示,第 2 个字节表示下一个非零值的实际值。
      • 熵编码:使用熵编码做进一步的压缩。
    • JPEG - 2000:以离散小波变换算法为主。特点:高压缩率,无损压缩,渐进传输,感兴趣区域压缩,图像处理简单。
    • 电话语音压缩标准: 主要有 ITU 的 9.721,9.722,9.728,9.729 等建议。
    • 调幅广播语音压缩标准:主要有 ITU 的 9.722 建议。
    • 调频广播及 CD 音质的宽带音频压缩标准:主要采用 MPEG - 1 或 MPEG - 2,双杜比 AC - 3 等建议。
      • MP1—— 用于数字盒式磁带。
      • MP2—— 层二复杂度适中,用于数字广播的音频编码,CD - ROM 和 VCD。
      • MP3—— 层三最复杂,用于综合业务数字网 ISDN 上的音频传输。
    • MPEG - 1 音频标准(MP1,MP2,MP3): 提供了三个独立的压缩层次。
    • MPEG - 2 音频标准:比 MPEG - 1 增加了 16kHz,22.05kHz,24kHz 的采样频率,扩展了编码器的输出速率范围,同时增加了声道数,支持 5.1 和 7.1 通道的环绕立体声。
    • MPEG - 2 AAC 音频标准:是非常灵活的声音感知编码标准。
    • MPEG - 4 音频标准:包括自然音频,结构音频混合在一起的合成编码。
  2. 视频压缩编码标准

    • U - T 制定的标准称之为建议,并命名为 H.26X 系列,主要用于实时视频通信。H.263 编码能提供更好的图像质量,更低的速率,是 IP 视频通信采用最多的编码方法。2003 年正式公布 H.264 标准。H.264/AVC 广泛应用于多媒体流服务,视频点播,可视游戏,低码率移动多媒体通信(视频手机),实时多媒体监控,数字电视,虚拟会议等。
    • ISO/IEC 制定的标准称为 MPEG - X,主要用于视频存储,视频广播和视频流媒体。MPEG 系列是影响最大的多媒体技术标准。已推出的标准包括:MPEG - 1,2,4,7,21。
      • MPEG - 1 针对 1.5Mb/s 以下传输速率,是通常的 VCD 制作格式,文件扩展名包括 mpg/mlv/mpe/mpeg/dat。
      • MPEG - 2 针对标准数字电视和高清电视在各种应用下的压缩方案和系统层的详细规定,不是 MPEG - 1 的简单升级,适用于广播级的数字电视的编码和传送,被认定为 SDTV 和 HDTV 的编码标准。应用于 DVD/SVCD/HDTV, 文件扩展名 mpg/m2v/mpe/mpeg/vob。
      • MPEG - 4 针对流式媒体的高质量视频,能够保存接近 DVD 画质的小体积视频文件,文件扩展名 asf/mov/DivX/avi。是最适合用于无线网络视频远程传输的视频压缩技术。
      • MPEG - 7 被描述为 “多媒体内容描述接口”,为各类多媒体信息提供标准化的描述。
      • MPEG - 21 是关键技术的集成,目标是定义一个多媒体框架。

注:只有 MPEG - 1,MPEG2,MPEG - 4 才是针对音视频压缩编码技术,其中 DVD 采用的 MPEG - 2 压缩编码技术。

❖ MP3 是定义在 MPEG - 1 标准中,其中的 “3” 是指 “MPEG - 1 Audio Layer 3”, 其压缩编码的核心技术是 “感知技术”。

十、习题

一、选择题

  1. 多媒体数据压缩的必要性主要是因为( )。
    A. 图像信息美观
    B. 增加计算机处理速度
    C. 给存储器、通信线路和计算机带来压力
    D. 方便图像传输

答案:C

  1. 以下哪种冗余是静态图像中最重要的数据冗余?( )
    A. 时间冗余
    B. 空间冗余
    C. 结构冗余
    D. 知识冗余

答案:B

  1. 霍夫曼编码属于哪种编码类型?( )
    A. 有损编码
    B. 无损编码
    C. 预测编码
    D. 变换编码

答案:B

  1. MPEG - 2 AAC 音频标准的特点是( )。
    A. 声音质量低
    B. 不灵活
    C. 非常灵活的声音感知编码标准
    D. 仅适用于特定设备

答案:C

  1. 以下哪个标准主要用于实时视频通信?( )
    A. MPEG - X
    B. H.26X 系列
    C. JPEG 标准
    D. MPEG - 7

答案:B

二、填空题

  1. 多媒体数据压缩的可能性在于图像的各像素之间存在________。

答案:相关性(冗余度)

  1. 统计编码属于________编码,根据消息出现的概率的分布特性进行压缩。

答案:无损

  1. 变换编码将空间域上的图像经正交变换映射到另一变换域上,使变换后的系数之间相关性________。

答案:降低

  1. JPEG 标准使用了离散余弦变换、量化、行程编码和________编码技术。

答案:霍夫曼

  1. MPEG - 4 针对________的高质量视频,能够保存接近 DVD 画质的小体积视频文件。

答案:流式媒体

三、简答题

  1. 简述多媒体数据压缩的必要性。

答案:大数据量的图像信息会给存储器的存储容量、通信线路的带宽以及计算机的处理速度增加极大压力。如果没有多媒体编码压缩技术的发展,大容量图像、视频信息的存储和传输就难以实现。

  1. 列举多媒体数据压缩中的几种冗余类型。

答案:空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余。

  1. 简述霍夫曼编码的特点。

答案:用变长的码字使冗余量达到最小,出现频率越高的像素值,编码长度越短,用尽可能少的代码表达信源数据。是变长编码中的最佳方法,属于无损编码。

  1. 比较 MPEG - 1 和 MPEG - 2 音频标准的不同之处。

答案:MPEG - 2 音频标准比 MPEG - 1 增加了 16kHz、22.05kHz、24kHz 的采样频率,扩展了编码器的输出速率范围,同时增加了声道数,支持 5.1 和 7.1 通道的环绕立体声。

  1. 说明 H.264/AVC 的应用领域。

答案:H.264/AVC 广泛应用于多媒体流服务、视频点播、可视游戏、低码率移动多媒体通信(视频手机)、实时多媒体监控、数字电视、虚拟会议等。

  • 9
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值