算术编码二进制例题a1a2a3a4_视频编码的基础知识

最新推荐文章于 2021-01-20 01:20:01 发布

weixin_39712969

最新推荐文章于 2021-01-20 01:20:01 发布

阅读量958

点赞数

文章标签：算术编码二进制例题a1a2a3a4

本文链接：https://blog.csdn.net/weixin_39712969/article/details/112199697

版权

在流媒体的平台搭建过程中，编码是无法避免的一个话题，为什么要编码？熟悉流媒体的朋友都知道，编码是为了压缩原有输入源的大小，使其更好的适应网络带宽，特别是在网络带宽不是很好的情况，所以学习流媒体，编码技术的理解和学习显得很重要，首先我们就来讲讲编码的基础知识。这里以H264为例子来讲解。

H264是什么?

H264是市面上常见的编码算法，其中编码后的文件，能够高效的在网络实现传输，在当前的视频直播、安防、教育等领域应用十分广泛，具有重要的应用价值。与MPEG-4不同，H264重点考虑了压缩的高效率和高可靠的网络传输。H264有三个不同档次，分别是"baseline"、"profile"、"main"，分别都应用在不同实际的场景。

h264编码器

编码基本流程

一般编码的基本流程分为宏块切割，时域变换频域，量化，熵编码等步骤。常用的变换，比如DCT变换，DCT变换可以减少计算量，降低解码时的预测漂移。量化过程在目的是减少图像编码长度，减少冗余信息，这些冗余信息都是视觉中难以察觉的信息。熵编码的基本原理是无损压缩编码方法，生成的码流可以在解码端，无失真的恢复出原数据。熵编码算法一般分为CAVLC和CABAC。下面简单分析下，这两种算法的原理。

CAVLC(基于上下文可变长编码)

主要用于亮度和色度残差数据编码，由于在量化后，非零系数主要在低频部分，高频大部分是0，量化后的数据经过 zig-zag 扫描，DC 系数附近的非零系数值较大，而高频位置上的非零系数值大部分是+1 和-1，CAVLC充分利用残差经过整数变换，量化后数据的特性进行压缩，减少冗余信息。

CABAC(基于上下文自适应二进制)

主要在复杂度和效率之间折中，基于一个查表概率模型。这是一种由大量实验统计而得到的概率模型。在编码时，需要动态选择概率模型进行编码，及时更新响应的概率模型。

H264在复杂的场景中，压缩和编码算法的性能非常优异，当在弱网的场景下，损耗比较小，这是由信道畸变带来的自适应方法比较好。

由上图知道，编码都是以宏块为单位进行的，首先按帧内或帧间预测编码进行处理，其中帧内主要是针对I帧进行，I帧一般是没有压缩或者压缩很低的，因为I帧是一组GOP的参考帧，如果没有了I帧，后面的P帧、B帧也无法解码出来，就会出现马赛克或者解码错误的情况。帧间编码主要是在B帧、P帧的情况。为了充分利用参考帧，H264使用"残差"编码，编码器要想重建图像，就必须使得残差经过反量化，为了去除噪声，提高图像的质量，往往还需要有Fliter，这种方式结构在大量的编码器中有应用，比如经典的FFmpeg，后面的文章我会详细的分析。

宏块(block)、slice

在视频的编码中，一副图像可以是一帧或者一场，一帧由奇数场和偶数场构成，有些应用场景就是用场来实现编码。一帧图像通常由很多个宏块组成，比如8X8的彩色像素块，多个宏块又会组成Slice的形式，I片只包含I宏块，P和B片可以由I宏块、P宏块或者B宏块。

场与帧

帧模式

场模式

2.档次

basline:使用I帧、P帧编码，使用自适应的变长编码的熵编码(CAVLC)。

main：使用B帧，支持基于上下文的算术编码(CABAC)

Extended profile：支持多路码流间的有效切换，比如在码流发生变化时，SP与SI的信息切换，改变误码性能等

由于每个档次设置不同参数，如码率，采样率等，就可以得到不同的级别。

3.H264编码格式

H264主要分为2层，VCL(视频编码层)和NAL(网络提取层)，VCL实际就是编码器的输出，然后把编码器的序列封装在NAL里面，形成一个个NAL单元，适应不同网络带宽，每个NAL单元包括一个RBSP和NAL头信息。

NAL单元序列

RBSP描述

什么叫参数集?参数集就是记录了编码序列的特征信息。如sps记录了帧数，I帧数目，图像size等信息。PPS记录了一个序列中编码模式选择，slice group数目，Fliter信息等。SPS和PPS在编码前会被写入头部，与实际的数据隔离。

4.Slice和Slice group

一副视频图像是由一个或者多个slice组成，每个slice包含一个或者若干个宏块，Slice可以帮助编码器实现误码的扩散和传输，相互间独立的，一片的预测不能以其它片中的宏块为参考图像，某一片的预测误差就不会影响到其它片中。

slice共有5种不同类型，I、P、B、SP、SI，这些类型有不同的片头，包含了不同的block，以下是一个大概图示说明，他们之间的关系。

slice语法结构

slice group可以包含多个slice，如下所示:

slice group

5.帧内预测

帧内预测是基于内部像素数据进行重建，P块用于4x4或16x16的相关操作，其中4x4有9种可选预测模式，16x16预测有4种预测模式。如下图的图标所示:

4x4预测模式

预测模式简介

预测块简介

16x16预测模式分为整体预测，有4种预测模式，如下所示。

16x16预测模式

16x16预测块

6.帧间预测

H264的帧间预测是基于运动补偿的预测模式，比如有各种类型的运动补偿，比如树状运动补偿。

7.H264的SP和SI

SP和SI帧基于帧间预测的运动补偿预测编码，SP的功能主要是使用不同的参考帧构建出相同图像帧，在某些场景下，SP帧可以替代I帧，主要用于多码流之间切换，图像和视频的拼接，SEEK等操作。SP帧编码效率低于P帧，高于I帧，这样在复杂的多码流，弱网的情况下，提高了适应能力和抗干扰能力。

SP帧流间切换

画面拼接

SP帧错误恢复

8.Fliter

如果反量化后出现马赛克效应，产生的原因有2个，最重要的是残差的DCT变换和量化。反量化过程中，变换系数有误差，会造成视觉不连续。解决这种问题，就需要有后置滤波器和环路滤波器。这两种滤波器也应用在不同场景中，

上面只是介绍了编解码的基本知识，偏重理论，虽然有些朋友觉得枯燥乏味，但是学好了理论，才能指导实践，后面的文章也会结合不同的平台，结合代码来讲解流媒体的相关技术。由于篇幅和时间的限制，不能把整个编码的基础知识全部讲完，后面会有详细的补充。欢迎各位朋友阅读和交流。

weixin_39712969

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算术编码二进制例题a1a2a3a4_视频编码的基础知识

在流媒体的平台搭建过程中，编码是无法避免的一个话题，为什么要编码？熟悉流媒体的朋友都知道，编码是为了压缩原有输入源的大小，使其更好的适应网络带宽，特别是在网络带宽不是很好的情况，所以学习流媒体，编码技术的理解和学习显得很重要，首先我们就来讲讲编码的基础知识。这里以H264为例子来讲解。H264是什么?H264是市面上常见的编码算法，其中编码后的文件，能够高效的在网络实现传输，在当前的视频直播、安防...
复制链接

扫一扫