深度学习赋能视频编码

最新推荐文章于 2024-05-16 20:01:18 发布

LiveVideoStack_

最新推荐文章于 2024-05-16 20:01:18 发布

阅读量3.7k

点赞数 9

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/96472461

版权

本文介绍了深度学习在视频编码领域的历史和最新进展，涵盖了神经网络视频编码的历史，如早期的预测技术和自编码器的发展。接着，详细讨论了基于深度学习的视频编码在帧内预测、分像素插值、环路滤波等方面的应用，展示了如何利用深度学习提升视频编码性能和效率。文章还提及了在帧内编码模式决策方面的研究，并对未来深度学习在视频编码标准中的应用进行了展望。

摘要由CSDN通过智能技术生成

640?wx_fmt=jpeg

深度学习赋予了诸如计算机视觉等领域新的研究契机，其应用也获得了视频编码领域的诸多关注。在LiveVideoStack线上分享中北京大学信息技术学院助理研究员王苫社详细介绍了当下深度学习在视频编码中的应用，以及其在视频编码标准中的前景。

文 / 王苫社

整理 / LiveVideoStack

直播回放

https://www2.tutormeetplus.com/v2/render/playback?mode=playback&token=edc99c13b9a24a2093486239dbac8785

大家好，我是来自北京大学的王苫社，本次带来的分享主要是从神经网络视频编码历史和基于深度学习的视频编码进展两方面来与大家探讨关于深度学习与视频编码中的一些问题。

1. 神经网络视频编码历史

1.1 起源

640?wx_fmt=jpeg

基于神经网络来做视频编码相关的内容最早可以追溯到上世纪八十年代，那时已经有人将三层人工神经网络用于图像变换编码，甚至有人在尝试神经网络硬件电路的实现。

640?wx_fmt=jpeg

到上世纪九十年代初，学界已经出现了基于多层感知机的图像编码，他们使用多层感知机的结构来做DPCM编码，这也是预测技术使用网络结构的第一篇Paper。

640?wx_fmt=jpeg

到九十年代中期的时候已经有了自适应预测编码，当时主要采用的是将图像划分为小块进行编码，同时也出现了利用空域临近像素作为辅助预测的方式。

640?wx_fmt=jpeg

到2000年左右关于编码出现了端到端的多层感知机编码和有图像扩展到视频编码两个主要问题。

640?wx_fmt=jpeg

自编码器在2006年开启了深度学习时代。

2. 基于深度学习的视频编码进展

640?wx_fmt=jpeg

接下来我将从预测增强、环路滤波和深度学习与视频编码标准三个方面来为大家介绍基于深度学习的视频编码到目前为止的进展。

最低0.47元/天解锁文章

LiveVideoStack_

关注

9
点赞
踩
34

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。