python视频压缩算法_深度学习之图像视频压缩技术

最新推荐文章于 2024-08-04 13:53:15 发布

weixin_39849894

最新推荐文章于 2024-08-04 13:53:15 发布

阅读量586

点赞数

文章标签： python视频压缩算法

本文链接：https://blog.csdn.net/weixin_39849894/article/details/111451488

版权

本文介绍了图像压缩算法，如JPEG和JPEG2000，并探讨了深度学习在图像压缩中的应用，特别是卷积神经网络（CNN）。深度学习压缩算法旨在优化变换并设计端到端解决方案，以超越JPEG2000的性能。评判压缩算法的标准包括比特位数（BPP）和PSNR。目前，利用深度学习设计的压缩算法已展现出超越商用JPEG2000的潜力。

摘要由CSDN通过智能技术生成

说到图像压缩算法，最典型的就是JPEG、JPEG2000等。

其中JPEG 采用的是以离散余弦转换(Discrete Cosine Transform) 为主的区块编码方式(如图2)。JPEG2000则改用以小波转换(Wavelet Transform) 为主的多解析编码方式，小波转换的主要目的是将图像的频率成分抽取出来。

在有损压缩下，JPEG2000的明显优势在于其避免了JPEG压缩中的马赛克失真效果。JPEG2000的失真主要是模糊失真，而模糊失真的主要原因在于高频量在编码过程中一定程度的衰减。在低压缩比情形下(比如压缩比小于10：1)，传统的JPEG图像质量有可能比JPEG2000好。JPEG2000在高压缩比的情形下，优势才开始明显。

整体来说，JPEG2000相比于传统JPEG，仍有很大技术优势，通常压缩性能可提高20%以上。当压缩比达到100：1时，JPEG压缩的图像已经严重失真并开始难以识别了，而JPEG2000的图像仍可识别。

深度学习技术设计压缩算法的目的

通过深度学习技术设计压缩算法的目的之一是学习一个比离散余弦变换或小波变换更优的变换，同时借助于深度学习技术还可以设计更简洁的端到端算法，因而能够设计出比JPEG2000等商用算法性能更优的算法。

在图片、视频压缩领域，使用最多的深度学习技术就是卷积神经网络(CNN)，下面会就卷积神经网络进行简单介绍。如图3所显示，像搭积木一样，一个卷积神经网络由卷积、池化、非线性函数、归一化层等模块组成。最终的输出根据应用而定，如在人脸识别领域，我们可以用它来提取一