图像质量与相似度评估指标 SSIM 和 MS-SSIM 的 Paddle 实现

引入

  • 自然图像具有极高的结构性,表现在图像的像素间存在着很强的相关性,尤其是在空间相似的情况下,这些相关性在视觉场景中携带着关于物体结构的重要信息
  • 我们假设人类视觉系统主要从可视区域内获取结构信息,人类视觉系统所以通过探测结构信息是否改变来感知图像失真的近似信息
  • 大多数的基于误差敏感度(Error Sensitivity)的质量评估方法(如 MSE, PSNR)使用线性变换来分解图像信号,这不会涉及到相关性
  • 而接下来要介绍的 SSIM 和 MS-SSIM 方法,便是通过图像结构相关性来衡量图像之间相似度和评估图像质量的两种经典的方法

参考资料

算法介绍

SSIM

  • SSIM(Structural SIMilarity)即结构相似性指数,是一种测量两个图像之间相似性的方法

  • 假定其中一幅图像具有完美的质量,则 SSIM 指数可以被视为另一幅图像质量的度量。

  • SSIM 指数的计算流程如下图所示:

  • 由 SSIM 测量系统可得相似度的测量可由三种对比模块组成,分别为:亮度(l),对比度(c),结构(s),各个模块的计算公式如下:

  • 总体的计算公式如下:

MS-SSIM

  • MS-SSIM(Multi-Scale Structural Similarity)即多尺度结构相似性指数

  • 是一种基于多尺度(图片按照一定规则,由大到小缩放)的 SSIM 指数

  • 具体的计算公式如下:

Paddle 实现

  • 基于 Pytorch MS-SSIM 项目开发了一个快速、可微分的 SSIM 和 MS-SSIM 的 Paddle 实现

  • 可以通过安装并调用 paddle_msssim 包快速实现 SSIM 和 MS-SSIM 的计算

  • Paddle MS-SSIM 与 SKImage、TensorFlow 和 Pytorch MS-SSIM 实现的测试对比结果如下:

    outputs(AMD Ryzen 4600H): 
    
    ===================================
                Test SSIM
    ===================================
    ====> Single Image
    Repeat 10 times
    sigma=0.0 ssim_skimage=1.000000 (247.7732 ms), ssim_tf=1.000000 (277.2696 ms), ssim_paddle=1.000000 (179.4677 ms), ssim_torch=1.000000 (183.6994 ms)
    sigma=10.0 ssim_skimage=0.932399 (226.1620 ms), ssim_tf=0.932640 (257.2435 ms), ssim_paddle=0.932636 (163.2263 ms), ssim_torch=0.932400 (179.1418 ms)
    sigma=20.0 ssim_skimage=0.786023 (224.1826 ms), ssim_tf=0.786032 (279.2126 ms), ssim_paddle=0.786017 (158.3070 ms), ssim_torch=0.786027 (180.0890 ms)
    sigma=30.0 ssim_skimage=0.637174 (237.5582 ms), ssim_tf=0.637183 (267.6092 ms), ssim_paddle=0.637165 (167.9277 ms), ssim_torch=0.637178 (181.7910 ms)
    sigma=40.0 ssim_skimage=0.515865 (221.0388 ms), ssim_tf=0.515876 (264.3230 ms), ssim_paddle=0.515857 (170.7676 ms), ssim_torch=0.515869 (189.0941 ms)
    sigma=50.0 ssim_skimage=0.422551 (222.6846 ms), ssim_tf=0.422558 (273.1971 ms), ssim_paddle=0.422542 (168.3579 ms), ssim_torch=0.422554 (176.7442 ms)
    sigma=60.0 ssim_skimage=0.351337 (215.1536 ms), ssim_tf=0.351340 (270.5560 ms), ssim_paddle=0.351325 (164.3315 ms), ssim_torch=0.351340 (194.6781 ms)
    sigma=70.0 ssim_skimage=0.295752 (210.0273 ms), ssim_tf=0.295756 (272.1814 ms), ssim_paddle=0.295744 (169.3864 ms), ssim_torch=0.295755 (178.9230 ms)
    sigma=80.0 ssim_skimage=0.253164 (239.2978 ms), ssim_tf=0.253169 (260.8894 ms), ssim_paddle=0.253157 (184.7061 ms), ssim_torch=0.253166 (181.4640 ms)
    sigma=90.0 ssim_skimage=0.219240 (224.7329 ms), ssim_tf=0.219245 (270.3727 ms), ssim_paddle=0.219235 (172.3580 ms), ssim_torch=0.219242 (180.5838 ms)
    sigma=100.0 ssim_skimage=0.192630 (238.8582 ms), ssim_tf=0.192634 (261.4317 ms), ssim_paddle=0.192624 (166.0294 ms), ssim_torch=0.192632 (175.7241 ms)
    Pass!
    ====> Batch
    Pass!
    
    ===================================
                Test MS-SSIM
    ===================================
    ====> Single Image
    Repeat 10 times
    sigma=0.0 msssim_tf=1.000000 (534.9398 ms), msssim_paddle=1.000000 (231.7381 ms), msssim_torch=1.000000 (257.3238 ms)
    sigma=10.0 msssim_tf=0.991148 (525.1758 ms), msssim_paddle=0.991147 (213.8527 ms), msssim_torch=0.991101 (243.9299 ms)
    sigma=20.0 msssim_tf=0.967450 (523.3070 ms), msssim_paddle=0.967447 (217.2415 ms), msssim_torch=0.967441 (253.1073 ms)
    sigma=30.0 msssim_tf=0.934692 (538.5145 ms), msssim_paddle=0.934687 (215.2203 ms), msssim_torch=0.934692 (242.5429 ms)
    sigma=40.0 msssim_tf=0.897363 (558.0346 ms), msssim_paddle=0.897357 (219.1107 ms), msssim_torch=0.897362 (249.1027 ms)
    sigma=50.0 msssim_tf=0.859276 (524.8582 ms), msssim_paddle=0.859267 (232.4189 ms), msssim_torch=0.859275 (263.1328 ms)
    sigma=60.0 msssim_tf=0.820967 (512.8726 ms), msssim_paddle=0.820958 (223.7422 ms), msssim_torch=0.820965 (251.9713 ms)
    sigma=70.0 msssim_tf=0.784204 (529.6149 ms), msssim_paddle=0.784194 (213.1742 ms), msssim_torch=0.784203 (244.9676 ms)
    sigma=80.0 msssim_tf=0.748574 (545.3014 ms), msssim_paddle=0.748563 (222.8581 ms), msssim_torch=0.748572 (261.0413 ms)
    sigma=90.0 msssim_tf=0.715980 (538.3886 ms), msssim_paddle=0.715968 (214.4464 ms), msssim_torch=0.715977 (282.6247 ms)
    sigma=100.0 msssim_tf=0.683882 (540.9150 ms), msssim_paddle=0.683870 (218.5596 ms), msssim_torch=0.683880 (244.1856 ms)
    Pass
    ====> Batch
    Pass
    
  • 具体的安装使用方法如下:

安装

!pip install paddle_msssim

计算 SSIM 和 MS-SSIM 指标

  • 这里使用如下三张图像来计算他们之间的 SSIM 和 MS-SSIM 指标,结果如下:

    Image
    Simga050100
    SSIM1.0000000.4229270.192567
    MS-SSIM1.0000000.8588610.684299
  • 具体的计算代码如下:

import cv2
import paddle
from paddle_msssim import ssim, ms_ssim

def imread(img_path):
    img = cv2.imread(img_path)
    return paddle.to_tensor(img.transpose(2, 0, 1)[None, ...], dtype=paddle.float32)

simga_0 = imread('./images/simga_0.png')
simga_50 = imread('./images/simga_50.png')
simga_100 = imread('./images/simga_100.png')

ssim_0 = ssim(simga_0, simga_0)
ssim_50 = ssim(simga_0, simga_50)
ssim_100 = ssim(simga_0, simga_100)
print('[SSIM] simga_0: %f simga_50: %f simga_100: %f' % (ssim_0, ssim_50, ssim_100))

ms_ssim_0 = ms_ssim(simga_0, simga_0)
ms_ssim_50 = ms_ssim(simga_0, simga_50)
ms_ssim_100 = ms_ssim(simga_0, simga_100)
print('[MS-SSIM] simga_0: %f simga_50: %f simga_100: %f' % (ms_ssim_0, ms_ssim_50, ms_ssim_100))
[SSIM] simga_0: 1.000000 simga_50: 0.422927 simga_100: 0.192567
[MS-SSIM] simga_0: 1.000000 simga_50: 0.858861 simga_100: 0.684299

作为损失函数使用

  • 随机初始化的一张雪花图像,使用 SSIM 和 MS-SSIM 作为损失函数去拟合目标图像
import os
import sys
import paddle
import numpy as np

from PIL import Image
from paddle.optimizer import Adam
from paddle_msssim import SSIM, MS_SSIM

loss_type = 'ssim'
assert loss_type in ['ssim', 'msssim']

if loss_type == 'ssim':
    loss_obj = SSIM(win_size=11, win_sigma=1.5, data_range=1, size_average=True, channel=3)
else:
    loss_obj = MS_SSIM(win_size=11, win_sigma=1.5, data_range=1, size_average=True, channel=3)


np_img1 = np.array(Image.open("./images/simga_0.png"))

img1 = paddle.to_tensor(np_img1.transpose(2, 0 , 1)).unsqueeze(0) / 255.0
img2 = paddle.rand(img1.shape)

img1 = paddle.to_tensor(img1, stop_gradient=True)
img2 = paddle.to_tensor(img2, stop_gradient=False)

with paddle.no_grad():
    ssim_value = loss_obj(img1, img2).item()
    print("Initial %s: %f:" % (loss_type, ssim_value))

optimizer = Adam(parameters=[img2], learning_rate=0.05)

step = 0
while ssim_value < 0.9999:
    step += 1
    optimizer.clear_grad()
    loss = loss_obj(img1, img2)
    (1 - loss).backward()
    optimizer.step()

    ssim_value = loss.item()
    if step % 10 == 0:
        print('step: %d %s: %f' % (step, loss_type, ssim_value))

img2_ = (img2 * 255.0).squeeze()
np_img2 = img2_.detach().numpy().astype(np.uint8).transpose(1, 2, 0)
results = Image.fromarray(np.concatenate([np_img1, np_img2], 1))
results.save('results_%s.png' % loss_type)
results

Initial ssim: 0.010401:
step: 10 ssim: 0.225660
step: 20 ssim: 0.733606
step: 30 ssim: 0.919254
step: 40 ssim: 0.970057
step: 50 ssim: 0.990348
step: 60 ssim: 0.998122
step: 70 ssim: 0.999767

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H0DIo8dz-1646470420843)(output_9_1.png)]
在这里插入图片描述

更多

  • 更多使用细节和示例可以参考 Paddle-MSSSIM 的 Github 仓库

示例项目(To do…)

  • 使用 SSIM 和 MS-SSIM 指标作为损失函数训练一个自编码器(AutoEncoder)模型
  • 4
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: PSNR(Peak Signal-to-Noise Ratio)和SSIM(Structural Similarity Index)是用来衡量两幅图像之间相似度指标。 PSNR是使用峰值信噪比来度量图像质量的一种方法。它使用均方误差(MSE)来衡量两幅图像之间的差异,MSE越小代表图像之间的差异越小,相似度越高。PSNR计算公式为: PSNR = 10 * log10((255^2) / MSE) 其中255是像素值的最大可能值,MSE为两幅图像像素之间差值的平方和的平均值。 SSIM是一种结构相似性指数,它不仅考虑了亮度的差异,还考虑了对比度和结构的差异。SSIM计算公式为: SSIM = (2 * μx * μy + c1) * (2 * σxy + c2) / ((μx^2 + μy^2 + c1) * (σx^2 + σy^2 + c2)) 其中μx和μy分别是两幅图像的平均值,σx^2和σy^2分别是两幅图像的方差,σxy是两幅图像的协方差,c1和c2是预定义的常数,用来避免分母为零的情况。 在MATLAB中,可以使用相关函数来计算PSNR和SSIM。比如,使用函数`imread`读取两幅图像,然后使用函数`imresize`来确保图像的大小一致,再使用函数`psnr`来计算PSNR,使用函数`ssim`来计算SSIM。 示例代码如下: ```matlab image1 = imread('image1.jpg'); image2 = imread('image2.jpg'); image1 = imresize(image1, size(image2)); % 确保图像大小一致 psnrValue = psnr(image1, image2); ssimValue = ssim(image1, image2); ``` 以上代码读取了两幅图像,并将它们的大小调整为一致,然后分别计算了PSNR和SSIM的值。 希望以上内容对您有所帮助。 ### 回答2: 图像相似度PSNR(Peak Signal-to-Noise Ratio)和SSIM(Structural Similarity Index)是常用于评估图像质量指标,用于度量两幅图像之间的相似程度。以下是使用Matlab实现这两种相似度指标的方法: 1. PSNR实现: PSNR是通过比较原始图像和重建图像的均方误差来评估图像质量的。在Matlab中,可以使用以下代码计算PSNR: ```matlab % 读取原始图像和重建图像 originalImage = imread('原始图像路径'); reconstructedImage = imread('重建图像路径'); % 计算MSE(均方误差) mse = sum(sum((double(originalImage) - double(reconstructedImage)).^2)) / (numel(originalImage)); % 计算PSNR psnr = 10 * log10((255^2) / mse); ``` 2. SSIM实现SSIM通过比较原始图像和重建图像的亮度、对比度和结构相似性来评估图像质量的。在Matlab中,可以使用以下代码计算SSIM: ```matlab % 读取原始图像和重建图像 originalImage = imread('原始图像路径'); reconstructedImage = imread('重建图像路径'); % 计算SSIM [ssimValue, ~] = ssim(originalImage, reconstructedImage); ``` 需要注意的是,上述代码中的图像路径需要根据实际情况进行修改,同时保证原始图像和重建图像具有相同的大小。 这样就可以使用Matlab来实现图像相似度PSNR和SSIM的计算了。 ### 回答3: 图像相似度是用来衡量两幅图像之间的相似程度的一种指标。PSNR(Peak Signal-to-Noise Ratio)和SSIM(Structural Similarity Index)是常用的图像相似度评价方法。在Matlab中,可以通过以下步骤实现这两种方法的计算。 首先,对于PSNR,可以通过以下几个步骤实现: 1. 使用imread函数读取待比较的两幅图像,分别命名为img1和img2。 2. 使用im2double函数将图像转换为double类型的数据,并将像素值缩放到0-1范围内。 3. 计算两幅图像的均方误差(MSE),可以通过以下代码实现: mse = sum(sum((img1 - img2).^2)) / numel(img1); 其中,.^2表示对每个元素进行平方运算,numel函数用于计算图像的像素总数。 4. 计算PSNR值,使用以下代码实现: psnr = 10 * log10(1^2 / mse); 其中,1表示图像的最大像素值。 其次,对于SSIM,可以通过以下几个步骤实现: 1. 使用ssim函数计算两幅图像SSIM指数,可以通过以下代码实现ssim_val = ssim(img1, img2); 其中,img1和img2为待比较的两幅图像。 2. 处理ssim_val的输出结果。 通过以上步骤,我们可以得到两幅图像之间的PSNR和SSIM值。这些值越高,表示两幅图像相似度越高。需要注意的是,这两种方法都只能用于评价图像在感知上的相似度,并不能完全代替人眼对图像的主观判断。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值