视频压缩编码基础知识(上)

文本位于文章底部

目前最新的视频编码器应该是H265/HEVC主要应用于高质量视频压缩,为未来2K、4K视频传输打基础,缺点是编解码消耗资源大
在这里插入图片描述在这里插入图片描述

预测编码:
利用帧内部的相关性,只传输实际像素与参考像素的差值,这样的压缩方式叫做帧内预测编码,编码方法叫差分脉冲编码。
利用帧间的相关性进行差分预测编码。
变换编码:
视频信号中包含大量的直流与低频成分(平坦部分)以及少量的高频成分(细节部分)。因此将其从空域转为频域利于压缩编码。有K-L编码,离散余弦变换(DCT)。
熵编码:
根据统计特性进行码率压缩,通常有哈夫曼编码与算术编码。意义为用最少的码字表示信息符号。

1.基于波形编码:通过像素、亮度、色度等进行压缩编码,基于内容编码:通过对形状、纹理、运动进行编码。

2.PCM (脉冲编码调制),CRT(阴极射线管显示器),PSNR(峰值信噪比),VCL(视频编码层),MPEG(动态图像专家组),AVC(先进视频编码),NAL全称Network Abstract Layer, 即网络抽象层。

3.帧编码中帧的邻近行空间相关性强,时间相关性弱,场编码邻近行直接空间相关性弱,时间相关性强。运动强用场编码,静态多用帧编码。

4.YUV,与RGB可以转换
其中 Y 表示明亮度(Luminance、Luma),也就是灰阶值。
U、V 表示色度(Chrominance 或 Chroma),描述的是色调和饱和度。

视频信号的预处理
色彩插值:
由于一个CCD只能感应单色的色调值,在CCD上加多色滤镜阵列,通过相邻多个像素的CCD的插值凑齐每个像素点的RGB值。 有相邻元素复制法,双线性插值算法。

伽马校正:
由于显示器的色彩强度与其电压并不是线性的所以需要校正,通常时幂指数关系。
图像增强:
平滑滤波,中值滤波,相当于低通滤波器,边缘模糊化,可以平滑噪声但会磨去细节
直方图均衡,平衡各个灰度值的数目使其符合信息熵最大化
锐化,与低通滤波相反,通过微分、高通滤波实现
白平衡,在不同色温下的光感元件感受到的彩色不同,色温高偏蓝,色温低偏红。
全局平衡法:假设全局的RGB统计平均相同
局部白平衡法:取最亮为白色区域进行校准,传统方法通过拍白色的物体校准。
H.264编码三种模式

1、基本档次(Baseline Profile):利用I片和P片支持帧内和帧间编码,支持利用基于上下文的自适应的变长编码进行的熵编码(CAVLC)。主要用于可视电话、会议电视、无线通信等实时视频通信。

2、主要档次(Main Profile):支持隔行视频,采用B片的帧间编码和采用加权预测的帧间编码;支持利用基于上下文的自适应的算术编码(CABAC)。主要用于数字广播电视与数字视频存储。

3、扩展档次(Extended Profile):支持码流之间有效的切换(SP和SI片)、改进误码性能,但不支持隔行视频和CABAC。

SP帧的作用:为了解决定期插入I帧带来的视频流数据量急剧增加和流间切换引起的漂移问题, H. 264视频编码标准定义了两种新型帧, 即SP帧和SI帧。

SP帧能够像I帧一样提供无缝切换点,从而实现码流间的无缝连接。同时由于SP帧采用基于帧间预测的运动补偿预测编码技术,所以其大小远小于I帧。

SP帧的编码基本原理同P帧类似,仍是基于帧间预测的运动补偿预测编码,两者之间的差异在于: SP帧能够参考不同参考帧重构出相同的图像帧。 由于这一特性, SP帧可以取代I帧,广泛应用于流间切换、拼接、随机接入、快进快退和错误恢复中,同时大大降低了码率的开销。在某些应用中, SI帧与SP帧一起被使用,例如不同码流间的切换、错误恢复等。SI帧像I帧一样仅仅用空间预测,但重构图像与采用运动补偿预测编码技术的SP帧完全相同。

• 时间上的冗余信息(temporal redundancy)
在视频中,相邻的帧(frame)与帧之间通常有很强的关连性,这样的关连性即为时间上的冗余信息。这即是上一次学习中的帧间压缩。连续的图像往往非常相近,由于一些小运动造成了细小差别。这种减小冗余的方法可以存储和上一帧或者下一帧不同的地方。这样就可以减少存储了。这个过程就称作运动补偿。位移是利用运动向量得出的。
• 空间上的冗余信息(spatial redundancy)
在同一张帧之中,相邻的像素之间通常有很强的关连性,这样的关连性即为空间上的冗余信息。这即是上一次学习中的帧内压缩。比如一个像素点是绿色,那它相邻的像素点可能就是深绿或者浅绿,甚至就是绿。
• 统计上的冗余信息(statistical redundancy)
统计上的冗余信息指的是欲编码的符号(symbol)机率分布是不均匀(non-uniform)的。
• 感知上的冗余信息(perceptual redundancy)
感知上的冗余信息是指在人在观看视频时,人眼无法察觉的信息。

目前最新的视频编码标准为ITU-T视讯编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)所提出的H.264/AVC。(H.265/AVC)

• H264
H264是新一代的编码标准,以高压缩高质量和支持多种网络的流媒体传输著称,在编码方面,我理解的他的理论依据是:参照一段时间内图像的统计结果表明,在相邻几幅图像画面中,一般有差别的像素只有10%以内的点,亮度差值变化不超过2%,而色度差值的变化只有1%以内。所以对于一段变化不大图像画面,我们可以先编码出一个完整的图像帧A,随后的B帧就不编码全部图像,只写入与A帧的差别,这样B帧的大小就只有完整帧的1/10或更小!B帧之后的C帧如果变化不大,我们可以继续以参考B的方式编码C帧,这样循环下去。这段图像我们称为一个序列(序列就是有相同特点的一段数据),当某个图像与之前的图像变化很大,无法参考前面的帧来生成,那我们就结束上一个序列,开始下一段序列,也就是对这个图像生成一个完整帧A1,随后的图像就参考A1生成,只写入与A1的差别内容。
在H264协议里定义了三种帧,完整编码的帧叫I帧,参考之前的I帧生成的只包含差异部分编码的帧叫P帧,还有一种参考前后的帧编码的帧叫B帧。
H264采用的核心算法是帧内压缩和帧间压缩,帧内压缩是生成I帧的算法,帧间压缩是生成B帧和P帧的算法。

DCT变换可以消除图像的空间冗余,Huffman编码可以消除图像的信息熵冗余。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
前 言 2 第1章 绪 论 9 1.1信息化与视频通信 9 1.1.1什么是信息 9 1.1.2什么是信息化 9 1.1.3 我国的信息化和视频通信 9 1.2 视频信息和信号的特点 10 1.2.1 直观性 10 1.2.2 确切性 10 1.2.3 高效性 10 1.2.4 广泛性 10 1.2.5 视频信号的高带宽性 10 1.3 视频压缩编码要求和可能性 11 1.3.1 视频压缩编码目标 11 1.3.2 视频压缩的可能性 11 1.4 视频压缩编码技术综述 12 1.4.1 基本结构 12 1.4.2 基于波形的编码 12 1.4.3 基于内容的编码 13 1.4.4 三维(立体)视频编码 13 参考文献 14 第2章 数字视频 15 2.1 数字电视的基本概念 15 2.1.1 数字电视的优越性 15 2.1.2 数字电视的PCM原理 16 2.2 数字电视信号 18 2.2.1 电视信号的时间和空间取样 18 2.2.2 彩色空间 19 2.2.3 彩色电视取样格式 19 2.2.4 数字电视信号的编码参数 20 2.3 视频信号的预处理 21 2.3.1 色彩插值(Color Interpolation) 21 2.3.2 色彩校正(Color Correction) 22 2.3.3 伽马校正(Gamma Correction) 23 2.3.4 图像增强(Image Enhancement) 24 2.3.5 白平衡(White Balance) 27 2.4 视频质量 29 2.4.1 主观质量的评定 29 2.4.2 客观质量的测量 29 参考文献 31 第3章 视频压缩编码的基本原理 32 3.1 预测编码 32 3.1.1 预测编码的基本概念 32 3.1.2 帧内预测编码 33 3.1.3 帧间预测编码 37 3.1.4 运动估计 41 3.2 变换编码 54 3.2.1 变换编码的基本概念 54 3.2.2 K-L变换 54 3.2.3 离散余弦变换DCT 55 3.2.4 锯齿形扫描和游程编码 57 3.3 变换编码与预测编码的比较 58 3.4 熵编码 59 3.4.1 变长编码 59 3.4.2 算术编码 59 参考文献 62 第4章 视频编码标准简介 63 4.1视频编码发展简史 63 4.2 H.261标准 63 4.2.1 图像格式 63 4.2.2 H.261视频编解码器 64 4.3 H.263标准 68 4.3.1 H.263标准图像格式 68 4.3.2 H.263视频信源编码算法 69 4.4 MPEG-1标准 69 4.4.1 功能 69 4.4.2 图像类型和编码结构 69 4.5 MPEG-2 70 4.5.1 MPEG-2编码复用系统 70 4.5.2 档次和级别 71 4.5.3 MPEG-2视频编码器 72 4.6 JPEG标准 73 参考文献 76 第5章 MPEG-4压缩编码标准 77 5.1 MPEG4标准概述 77 5.1.1 MPEG-4标准特性 77 5.1.2 AVO及数据结构 77 5.2 MPEG-4标准构成 78 5.2.1 系统 78 5.2.2 音频 80 5.2.3 视频 80 5.2.4 网格动画 84 5.2.5 其余 85 5.3 MPEG-4编码技术 85 5.3.1 形状编码 85 5.3.2 可扩展性编码 87 5.3.3 sprite编码 90 5.3.4 视频系统合成 91 5.4 MPEG-4档次和级 93 参考文献 96 第6章H.264/AVC编码器原理 97 6.1 H.264/AVC的应用 97 6.2 H.264/AVC编解码器 98 6.2.1 H.264编解码器特点 98 6.2.2 H.264编码器 98 6.2.3 H.264解码器 99 6.3 H.264/AVC的结构 99 6.3.1 名词解释 99 6.3.2 档次和级 99 6.3.3 编码数据格式 100 6.3.4参数图像 102 6.3.5 片和片组 102 6.4 帧内预测 104 6.4.1 4×4亮度预测模式 105 6.4.2 16×16亮度预测模式 107 6.4.3 8×8色度块预测模式 109 6.4.4 信号化帧内预测模式 109 6.5 帧间预测 110 6.5.1 树状结构运动补偿 110 6.5.2 运动矢量 111 6.5.3 MV预测 113 6.5.4 B片预测 114 6.5.5加权预测 117 6.6 H.264的SP/SI帧技术(SP片或SI宏块的P宏块) 117 6.6.1 SP/SI帧的应用 118 6.6.2 SP/SI帧的基本原理 120 6.6.3 实验结果和性能分析 123 6.7 整数变换与量化 124 6.7.1 整数变换 125 6.7.2 量化 129 6.7.3 DCT直流系数的变换量化 131 6.8 CAVLC(基于上下文自适应的可变长编码) 132 6.8.1熵编码的基本原理 132 6.8.2 CAVLC的基本原理 133 6.8.3 CAVLC的上下文模型 133 6.8.4 CAVLC的编码过程 133 6.8.5 CAVLC解码过程 135 6.8.6 CAVLC编解码过程实例 138 6.8.7 CAVLC 与UVLC比较 139 6.9 CABAC(基于上下文的自适应二进制算术熵编码) 141 6.9.1 自适应算术编码 141 6.9.2 上下文模型 144 6.9.3 对输入流预编码 146 6.9.4 初始化 147 6.9.5 结论 147 6.10 码率控制 148 6.10.1基于Lagrangian优化算法的H.264编码控制模型 148 6.10.2 实验结果和性能分析 151 6.11 去方块滤波 153 6.11.1 去方块滤波基本概念 154 6.11.2 边界分析 155 6.11.3 滤波过程 157 6.12 其余特征 160 6.12.1 参考图像管理 160 6.12.2 重排序 160 6.12.3 隔行视频 161 6.12.4 数据分割片 162 6.12.5 H.264传输 162 参考文献 164 第7章 H.264的句法和语义 166 7.1 句法 166 7.1.1句法元素的分层结构 166 7.1.2句法的表示方法 169 7.2句法表 170 7.3 语义 189 7.3.1 NAL层语义 190 7.3.2 序列参数集语义 192 7.3.3 图像参数集语义 194 7.3.4片头语义 196 7.3.5参考图像序列重排序的语义 201 7.3.6加权预测的语义 202 7.3.7参考图像序列标记 (marking)操作的语义 203 7.3.8 片数据的语义 204 7.3.9 宏块层的语义 205 7.3.10 宏块预测的语义 210 7.3.11子宏块预测的语义 211 7.3.12 用CAVLC方式编码的残差数据的语义 213 7.3.13 用CABAC方式编码的残差数据的语义 213 7.4总结 213 参考文献 214 第8章 H.264/AVC解码器的原理和实现 215 8.1 解码器原理 215 8.2 NAL单元 216 8.2.1 NAL单元结构 216 8.2.2 NAL单元解码过程 216 8.3 图像序列号(PICTURE ORDER COUNT)的计算 217 8.3.1图像序列号(POC) 217 8.3.2 POC类型为0的POC计算 219 8.3.3 POC类型为1的POC计算 220 8.3.4 POC类型为2的POC计算 221 8.4 宏块片组映射图的产生 221 8.5 片数据分割的解码 223 8.6 参考图像列表的初始化 224 8.6.1 图像序号的计算 224 8.6.2 参考图像列表的初始化 225 8.6.3 参考帧列表的重排序 228 8.7 解码的参考图像的标记过程 230 8.7.1 frame_num不连续的解码过程 231 8.7.2 参考图像滑窗标记过程 231 8.7.3 参考图像的自适应内存控制标记过程 231 8.8 帧内预测 233 8.8.1 4x4亮度块预测方式的提取 234 8.8.2 4x4亮度块的帧内预测编码方式 235 8.8.3 16x16亮度块的帧内预测方式 240 8.8.4 8x8色度块的帧内预测方式 243 8.9 帧间预测解码处理 245 8.9.1 MV分量及参考索引获取 246 8.9.2 帧间预测像素解码处理 248 8.10 变换系数解码 254 8.10.1 变换系数逆扫描过程 255 8.10.2 DCT变换系数中直流系数的逆变换量化 256 8.10.3 残差变换系数的反量化 258 8.10.4 残差变换系数的逆DCT变换 258 8.10.5 去方块滤波前的图像恢复与重建 258 8.11 SP片中的P宏块和SI片中的SI宏块的解码过程 259 8.11.1 主SP片中P宏块的解码过程 259 8.11.2 辅SP/SI片的解码过程 261 参考文献 263 第9章 H.264视频编码传输的QOS 264 9.1 互联网视频传输QOS 264 9.1.1 错误恢复在视频通信中的重要性和实现途径 264 9.1.2 基于块的混合视频编码框架 265 9.1.3 视频通信中提高QoS的抗误码和错误恢复技术 266 9.2 无线网视频传输QOS 271 9.2.1 无线视频通信系统 271 9.2.2 无线信道编码和错误控制 272 9.2.3 无线视频通信的应用 276 9.2.4 H.264无线通信中传输结构 277 9.2.5无线视频传输的鲁帮性研究 278 9.3 H.264视频编解码标准的错误恢复 279 9.3.1 H.264的视频编码层的错误恢复 279 9.3.1 H.264的网络提取层的错误恢复 281 参考文献 284 术语及英文解释 286 附录一 CAVLC相关码表 297 附录二 CABAC相关码表 304 附录三 H.264档次和级 318

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值