FFmpeg计算图像的SSIM的原理

最新推荐文章于 2025-03-12 13:21:10 发布

showerlxy

最新推荐文章于 2025-03-12 13:21:10 发布

阅读量1.2k

点赞数 32

文章标签： ffmpeg 视频

本文链接：https://blog.csdn.net/showerlxy/article/details/138305683

版权

SSIM算法基于HVS更擅长从图像中提取结构信息的事实，并且利用结构相似度来计算图像的感知质量。
在Z. Wang等人的论文Multi-scale structural similarity for image quality assessment中也提到， $SS I M$ 算法要好于当时的其它的感知图像质量指标。
SSIM的计算公式：
在这里插入图片描述
SSIM计算中的图像分割
==在整幅图片的跨度上，图像亮度的均值和方差变化较为剧烈；并且图像上不同区块的失真程度也有可能不同；再者人眼睛每次只能聚焦于一处，更关注局部数据而非全局数据。==因此如上的 $SS I M$ 算法不能直接作用于一整副图像。
在论文Image quality assessment: From error visibility to structural similarity中，作者采用 $11 \times 11$ 的滑动窗口将整副图像分割为 $N$ 个patch，然后计算每一个patch的 $SS I M$ ，最后计算所有patch的 $SS I M$ 值的平均数（ $\ \ SSIM:MSSIM$ ）作为整副图像的 $SS I M$ 。
为避免滑动窗口带来的块效应，在计算每个patch的均值 $\mu$ 和方差 $\sigma^2$ 时，作者采用 $\sigma=1.5$ 的高斯卷积核作加权平均。整副图像有 $N$ 个patch，则 $MSS I M$ 的计算公式为：
在这里插入图片描述
FFmpeg计算SSIM的实际实现

FFmpeg提供了计算 $SS I M$ 的实现：
https://github.com/FFmpeg/FFmpeg/blob/master/tests/tiny_ssim.c。
从代码注释中看到：为提升算法性能，没采用论文中的高斯加权方式计算每个patch的 $SS I M$ ，而采用了 $\times 8$ 的块来计算每个patch的 $SS I M$ 。
在这里插入图片描述
standard approximation of overlapped 8x8 block sums

解释一下注释中的standard approximation of overlapped 8x8 block sums 的含义。分解成两个部分来解释：overlapped 8x8 block和sums。
overlapped 8x8 block的含义：
FFmpeg在计算图像 $SS I M$ 时，首先以 $\times 4$ 的块大小把图1所示的分辨率为

最低0.47元/天解锁文章