Overview of the Low Complexity Enhancement Video Coding (LCEVC) Standard

最新推荐文章于 2022-11-21 13:44:07 发布

你好，请叫我靓仔

最新推荐文章于 2022-11-21 13:44:07 发布

阅读量791

点赞数 2

分类专栏： C++ 视频编码 LCEVC 文章标签： c++ 音视频

本文链接：https://blog.csdn.net/DuoKingg/article/details/127950024

版权

C++ 同时被 3 个专栏收录

19 篇文章

订阅专栏

视频编码

17 篇文章

订阅专栏

LCEVC

2 篇文章

订阅专栏

本文探讨了LCEVC编码技术的基本架构与核心组件，包括变换、码流构造及上采样等关键技术，并介绍了时域预测的具体实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

导读

做了一段时间LCEVC了，主要是看代码，有些迷惑的地方才会对应到综述去看一下对应的技术到底是怎样。慢慢的陆续也算看的差不多了，可以拿出来挨个模块写一下了
看这个作者列表，现在搞LCEVC的这帮人，基本都是V-Nova的人。果然啊，怪不得他们用这个赚钱。

核心观点

codec对于序列的低频分量比较敏感，或者说是比较擅长，那么这部分压缩工作就交给base codec。高频这部分残差信息就单独拿出来处理就好了，因为像素之间的相关性其实还是很强的，所以这个时候利用上采样，就相当于什么呢？我的理解是，相当于我们在做一个条件编码，消除了一部分相关性。

基本架构

在这里插入图片描述
基本架构这里还是有一些比较细的东西。

增强层1是可选的层
只有增强层2有时域预测，并且时域预测是开关是可控的。
控制增强层1/2开关，通过qstep控制，qstep=32767，就是相当于都量化为0，就是关。
一般是只打开增强层2
另外，上采样的比例是可以控制的，1/4或者1/16.
也有一种骚操作，是增强层1上采样比例为1，然后qstep!=32767。这样的意思就是：基本层的残差先编码一下，然后再上采样。这样如果有意义的话，我觉得是需要增强层1的量化步长小于基本层的才行。

码流构造

他是先编码完成基本层的编码。然后以SEI或者NALU的形式，加到每个NALU和面。
这里需要一些前置知识哦。基本码流中，是以AU为单位的，就是接入单元，一般一帧图像的所有NALU以及对应的SPS/PPS啥的组成一个AU。
所以LTM编码的时候，就先读基本层的码流，一个AU一个AU的读，然后编码这个AU对应的增强层码流，编码完之后，加到这个AU的后面。

变换

变换核的大小只有两种：22和44。
每次变换前，先将正方形残差块，拉直成为一个向量，然后做DCT。那么采用的就是4或者16个基向量的DCT变换。
代码中，就是每个WxH的残差平面会有，16个W/4 x H/4大小的变换系数平面。
每个变换系数平面，对应到的就是DT的一行，就是某一个频率分量。
可能是觉得采用的块太小了吧，所以没有使用二维DCT。
另外就是编码的时候，好像没有采用zigzag扫描，也就是简单的挨个编码。
DCT与IDCT