基于深度学习的参考帧生成

最新推荐文章于 2024-06-18 21:55:10 发布

Dillon2015

最新推荐文章于 2024-06-18 21:55:10 发布

阅读量1.4w

点赞数 1

分类专栏： H.266/VVC 视频编码深度学习文章标签：深度学习参考帧合成插帧

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dillon2015/article/details/125529909

版权

视频编码同时被 3 个专栏收录

216 篇文章 56 订阅

订阅专栏

155 篇文章 141 订阅

订阅专栏

31 篇文章 5 订阅

订阅专栏

本文来自提案JVET-T0058和JVET-U0087，该方法通过插帧的方法生成虚拟参考帧用于帧间预测。整个模型由几个子模型组成，分别进行光流估计、补偿和细节增强。

整体架构

整体架构如Fig.1所示，在视频编码过程中DPB中存着用于运动估计的参考帧，根据GOP结构当前帧有一个或多个前向、后向参考帧。提案中默认使用POC距离当前帧最近的两个参考帧生成虚拟参考帧，如Fig.1中当前帧POC是5，则使用POC为4和6的帧生成参考帧。生成的虚拟参考帧会被放入DPB用于参考，虚拟参考帧的POC设置为和当前帧相同。为了防止影响时域MVP中根据POC距离的MV缩放过程，虚拟参考帧的MV都设为0且被用作长期参考帧。在提案中，当前帧解码完成后虚拟参考帧就从DPB中移除。

对于高分辨率序列（4K或8K）由于资源受限不能对整帧直接使用神经网络处理，此时假设虚拟参考帧被分为多个区域，每个区域单独使用网络生成，然后将这些区域拼成参考帧。

网络模型

一般的视频插帧大都利用了光流估计和补偿，一般使用双向光流方法，然后通过一个线性模型将两个光流合成一个。提案中仅使用单光流模型。

如Fig.2，首先通过光流估计模型生成光流（输入为POC距离最近的两个参考帧），然后通过backward warping过程处理光流，处理后的光流和两个参考帧再通过fusion过程合成中间帧。中间帧会通过细节增强模型提升质量，细节增强模型包含两部分，PCD(Pyramid, Cascading and Deformable)用于时空优化和TSA (Temporal and Spatial Attention)用于提高重要特征的attention。

实验结果

感兴趣的请关注微信公众号Video Coding

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄9年

274
原创

855
点赞

2063
收藏

1017
粉丝

关注

私信

热门文章

分类专栏

AV1 5篇
H.266/VVC 155篇
AVS3 18篇
多媒体 28篇
scikit-video 4篇
opencv图像处理 2篇
数据分析 9篇
python 29篇
windows 3篇
电脑设置 7篇
机器学习 9篇
数据库 2篇
spark 5篇
graphx 2篇
计网 5篇
sklearn 1篇
pybrain 4篇
tensorflow 5篇
概率论与数理统计 1篇
linux 2篇
深度学习 31篇
视频编码 216篇
h.265/hevc 66篇
scikit-video 2篇
ffmpeg 6篇
DSP 1篇
opencv 6篇
图像处理 5篇

最新评论

DCC2020：VVC帧内预测中基于梯度的CU划分早停止
叮当361: 这个源码有木有啊或者他是怎么在测试软件上实现的在哪个函数里面改动的代码
图像质量评价（二）：VSI
周言溪: 你好请问还有这篇VSI的源码吗比较需要
VVC帧间预测（一）扩展的merge模式
sky_young: 空域候选列表构造顺序好像有点问题，应该是按照B1->A1->B0->A0->B2的顺序建立
变换系数熵编码
Dillon2015: 还是挺明显的，你可以找个编码器比较一下开启和关闭SDH的效果
变换系数熵编码
华函数: 但SDH只能减少一个CG中最后一个非0系数的符号位比特，其他非0系数还是要通过CABAC旁路编码进行，对于最终的码率降低的比例明显吗，还会引入失真

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。