用AI打破编解码器内卷，高通最新几篇顶会论文脑洞有点大

QbitAl

于 2021-10-01 12:02:09 发布

阅读量1.6k

点赞数 4

文章标签：算法计算机视觉机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QbitAI/article/details/120582354

版权

高通的AI视频编解码研究涉及帧间预测新思路、利用“过拟合”降低解码复杂度以及用语义感知和GAN提高压缩质量。通过结合AI技术，不仅提升了压缩性能，还降低了解码复杂度，为视频压缩带来创新解决方案。

摘要由CSDN通过智能技术生成

萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

用AI搞视频编解码器，现在路子有点“野”。

插帧、过拟合、语义感知、GAN……你想过这些“脑洞”或AI算法，也能被用到编解码器上面吗？

例如，原本的算法每帧压缩到16.4KB后，树林开始变得无比模糊：

但在用上GAN后，不仅画面更清晰，每帧图像还更小了，只需要14.5KB就能搞定！

又例如，用插帧的思路结合神经编解码器，能让最新压缩算法效果更好……

这一系列算法的思路，背后究竟是什么原理，用AI搞编解码器，潜力究竟有多大？

我们采访了高通工程技术副总裁、高通AI研究方向负责人侯纪磊博士，了解了高通一些AI编解码器中的算法细节和原理。

编解码器标准逐渐“内卷”

当然，在了解AI算法的原理之前，需要先了解视频到底是怎么压缩的。

如果不压缩，1秒30帧、8bit单通道色深的480p视频，每秒就要传输80+Mbps数据，想在网上实时看高清视频的话，几乎是不可能的事情。

目前，主要有色度子采样、帧内预测（空间冗余）和帧间预测（时间冗余）几个维度的压缩方法。

色度子采样，主要是基于我们眼睛对亮度比对颜色更敏感的原理，压缩图像的色彩数据，但视觉上仍然能保持与原图接近的效果。

最低0.47元/天解锁文章

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
用AI打破编解码器内卷，高通最新几篇顶会论文脑洞有点大

萧箫发自凹非寺量子位报道 | 公众号 QbitAI用AI搞视频编解码器，现在路子有点“野”。插帧、过拟合、语义感知、GAN……你想过这些“脑洞”或AI算法，也能被用到编解码器上面吗？...
复制链接

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。