python视频压缩算法_深度学习之图像视频压缩技术

本文介绍了图像压缩算法,如JPEG和JPEG2000,并探讨了深度学习在图像压缩中的应用,特别是卷积神经网络(CNN)。深度学习压缩算法旨在优化变换并设计端到端解决方案,以超越JPEG2000的性能。评判压缩算法的标准包括比特位数(BPP)和PSNR。目前,利用深度学习设计的压缩算法已展现出超越商用JPEG2000的潜力。
摘要由CSDN通过智能技术生成

说到图像压缩算法,最典型的就是JPEG、JPEG2000等。

其中JPEG 采用的是以离散余弦转换(Discrete Cosine Transform) 为主的区块编码方式(如图2)。JPEG2000则改用以小波转换(Wavelet Transform) 为主的多解析编码方式,小波转换的主要目的是将图像的频率成分抽取出来。

在有损压缩下,JPEG2000的明显优势在于其避免了JPEG压缩中的马赛克失真效果。JPEG2000的失真主要是模糊失真,而模糊失真的主要原因在于高频量在编码过程中一定程度的衰减。在低压缩比情形下(比如压缩比小于10:1),传统的JPEG图像质量有可能比JPEG2000好。JPEG2000在高压缩比的情形下,优势才开始明显。

整体来说,JPEG2000相比于传统JPEG,仍有很大技术优势,通常压缩性能可提高20%以上。当压缩比达到100:1时,JPEG压缩的图像已经严重失真并开始难以识别了,而JPEG2000的图像仍可识别。

深度学习技术设计压缩算法的目的

通过深度学习技术设计压缩算法的目的之一是学习一个比离散余弦变换或小波变换更优的变换,同时借助于深度学习技术还可以设计更简洁的端到端算法,因而能够设计出比JPEG2000等商用算法性能更优的算法。

在图片、视频压缩领域,使用最多的深度学习技术就是卷积神经网络(CNN),下面会就卷积神经网络进行简单介绍。如图3所显示,像搭积木一样,一个卷积神经网络由卷积、池化、非线性函数、归一化层等模块组成。最终的输出根据应用而定,如在人脸识别领域,我们可以用它来提取一

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值