ICME2021：基于CNN的HEVC帧内编码块快速划分

最新推荐文章于 2022-03-18 22:22:43 发布

Dillon2015

最新推荐文章于 2022-03-18 22:22:43 发布

阅读量3.4w

点赞数 2

分类专栏：视频编码 h.265/hevc 文章标签： HEVC 编码块划分 CNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dillon2015/article/details/118231146

版权

视频编码同时被 2 个专栏收录

216 篇文章 56 订阅

订阅专栏

66 篇文章 24 订阅

订阅专栏

本文来自ICME2021论文《CNN-BASED DEPTH MAP PREDICTION FOR FAST BLOCK PARTITIONING IN HEVC INTRA CODING 》

在HM中，通过递归调用RDO来选择最优的划分模式，整个过程计算复杂度很高且硬件实现不友好。论文使用CNN为HEVC的帧内编码生产深度图来进行快速划分。

论文提出使用深度图来表示CTU的划分，如Fig.1(b)深度图是一个8x8的矩阵，矩阵中每个元素代表64x64CTU的每个8x8块的深度。从Fig.1可以发现，深度图可以反映图像局部纹理的复杂度。论文设计了一个CNN模型来预测深度图，模型以CTU的亮度分量作为输入。得到深度图后CTU的划分结构就确定了，编码器可以跳过RDO过程直接处理每个CU。整个算法的流程如Fig.2所示。

深度图预测网络

本文设计了一个基于CNN的深度图预测网络，网络结构如Fig.3所示，网络以CTU的亮度通道作为输入，输出一个8x8的深度图。

网络的第1部分包括5个卷积层和3个池化层。然后是最大池化操作，pooling kernel尺寸分别我2，4，8，再加上未池化的特征共得到4个特征，反映了不同尺度的特征，这部分称为多池化层。3个池化的特征上采样后和为池化特征连接送到下一层。网络接下来的部分包含4个卷积层。除了输出层外所有的卷积层都使用ReLU。

损失函数

实验结果

数据集

数据集中的视频序列来自CDVL，分辨率包括{3840x2160，1920x1080，1280x720}，还有部分DIV2K中的图像，分辨率为1920x1080。

考虑到视频的时域相关性，训练序列每隔40帧取1帧。同时对DIV2K中的图像降采样到960x640和448x320以获得低分辨率数据。通过这种方式增加训练集的多样性。

所有的序列和图像使用HM16.20的AI配置编码，QP取{22,27,32,37}。编码过程中收集深度图，同时提取序列和图像的亮度分量并划分为64x64的块。最终数据集对4个QP包含764800个训练样本和78500个测试样本。

实验结果

由表3实验结果可知，在BD-Rate损失2.02%情况下，本文算法可以节省65.55%的编码时间，其中编码时间包括了CNN网络执行的时间。

感兴趣的请关注微信公众号Video Coding

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Dillon2015 CSDN认证博客专家 CSDN认证企业博客

码龄9年

274: 原创

2万+: 周排名

3701: 总排名

860万+: 访问

: 等级

1万+: 积分

1014: 粉丝

855: 获赞

412: 评论

2054: 收藏

私信

关注

热门文章

分类专栏

AV1 5篇
H.266/VVC 155篇
AVS3 18篇
多媒体 28篇
scikit-video 4篇
opencv图像处理 2篇
数据分析 9篇
python 29篇
windows 3篇
电脑设置 7篇
机器学习 9篇
数据库 2篇
spark 5篇
graphx 2篇
计网 5篇
sklearn 1篇
pybrain 4篇
tensorflow 5篇
概率论与数理统计 1篇
linux 2篇
深度学习 31篇
视频编码 216篇
h.265/hevc 66篇
scikit-video 2篇
ffmpeg 6篇
DSP 1篇
opencv 6篇
图像处理 5篇

最新评论

图像质量评价（二）：VSI
周言溪: 你好请问还有这篇VSI的源码吗比较需要
VVC帧间预测（一）扩展的merge模式
sky_young: 空域候选列表构造顺序好像有点问题，应该是按照B1->A1->B0->A0->B2的顺序建立
变换系数熵编码
Dillon2015: 还是挺明显的，你可以找个编码器比较一下开启和关闭SDH的效果
变换系数熵编码
华函数: 但SDH只能减少一个CG中最后一个非0系数的符号位比特，其他非0系数还是要通过CABAC旁路编码进行，对于最终的码率降低的比例明显吗，还会引入失真
图像质量评价（二）：VSI
2301_76724212: 你好，请问可以要一份这个代码嘛？

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。