深度学习赋能视频编码

本文介绍了深度学习在视频编码领域的历史和最新进展,涵盖了神经网络视频编码的历史,如早期的预测技术和自编码器的发展。接着,详细讨论了基于深度学习的视频编码在帧内预测、分像素插值、环路滤波等方面的应用,展示了如何利用深度学习提升视频编码性能和效率。文章还提及了在帧内编码模式决策方面的研究,并对未来深度学习在视频编码标准中的应用进行了展望。
摘要由CSDN通过智能技术生成

640?wx_fmt=jpeg

深度学习赋予了诸如计算机视觉等领域新的研究契机,其应用也获得了视频编码领域的诸多关注。在LiveVideoStack线上分享中北京大学信息技术学院 助理研究员王苫社详细介绍了当下深度学习在视频编码中的应用,以及其在视频编码标准中的前景。


文 / 王苫社

整理 / LiveVideoStack

直播回放

https://www2.tutormeetplus.com/v2/render/playback?mode=playback&token=edc99c13b9a24a2093486239dbac8785


大家好,我是来自北京大学的王苫社,本次带来的分享主要是从神经网络视频编码历史和基于深度学习的视频编码进展两方面来与大家探讨关于深度学习与视频编码中的一些问题。


1. 神经网络视频编码历史


1.1 起源


640?wx_fmt=jpeg


基于神经网络来做视频编码相关的内容最早可以追溯到上世纪八十年代,那时已经有人将三层人工神经网络用于图像变换编码,甚至有人在尝试神经网络硬件电路的实现。


640?wx_fmt=jpeg


到上世纪九十年代初,学界已经出现了基于多层感知机的图像编码,他们使用多层感知机的结构来做DPCM编码,这也是预测技术使用网络结构的第一篇Paper。


640?wx_fmt=jpeg


到九十年代中期的时候已经有了自适应预测编码,当时主要采用的是将图像划分为小块进行编码,同时也出现了利用空域临近像素作为辅助预测的方式。


640?wx_fmt=jpeg


到2000年左右关于编码出现了端到端的多层感知机编码和有图像扩展到视频编码两个主要问题。


640?wx_fmt=jpeg


自编码器在2006年开启了深度学习时代。


2. 基于深度学习的视频编码进展

 

640?wx_fmt=jpeg


接下来我将从预测增强、环路滤波和深度学习与视频编码标准三个方面来为大家介绍基于深度学习的视频编码到目前为止的进展。


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值