pytorch_ssim.ssim() TypeError: conv2d() received an invalid combination of arguments - got (Tensor,

目录

情况

原因A:批输入图片

原因B:图像尺寸不一致

SSIM简介


情况

 batch_ssim = pytorch_ssim.ssim(img1, img2).item()

TypeError: conv2d() received an invalid combination of arguments - got (Tensor, Tensor, padding=float, groups=int), but expected one of:

  • (Tensor input, Tensor weight, Tensor bias, tuple of ints stride, tuple of ints padding, tuple of ints dilation, int groups)
  • (Tensor input, Tensor weight, Tensor bias, tuple of ints stride, str padding, tuple of ints dilation, int groups)

原因A:批输入图片

该函数目前只接受一对图片作为输入,而不是整个epoch,因此在验证集批处理大小> 1 的情况下不可用。

The format of the input data is as follows:
torch.Size([4, 3, 256, 256])
torch.float32
torch.Size([4, 3, 256, 256])
torch.float32

解决:

循环每个图像以获取 SSIM 值

原因B:图像尺寸不一致

解决:resize

SSIM简介

结构相似性指数(SSIM)度量从一幅图像中提取3个关键特征:

  • 亮度

  • 对比度

  • 结构

  • 与其在全局范围内应用上述度量值(即一次在图像上的所有区域),不如在局部范围内应用这些度量值(即在图像的小部分中,然后取整体的平均值)。

    这种方法通常被称为平均结构相似度指数。

  • 使用一个11x11圆对称高斯加权函数(基本上就是一个11x11矩阵,其值来自高斯分布)在整个图像上逐像素移动。在每一步中,在局部窗口内计算局部统计信息和SSIM索引。

  • 只需取所有局部SSIM值的平均值,就得到了全局的 SSIM值。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
MS-SSIM(结构相似性索引度量)是一种用于测量图像相似性的指标。下面是如何使用PyTorch实现MS-SSIM的解释: 首先,我们需要导入必要的PyTorch库和方法: ```python import torch import torch.nn.functional as F from torch.autograd import Variable ``` 接下来,我们定义计算MS-SSIM的函数`ms_ssim`: ```python def gaussian(window_size, sigma): kernel = torch.FloatTensor([math.exp(-((x - window_size // 2)**2) / float(2 * sigma**2)) for x in range(window_size)]) return kernel / kernel.sum() def create_window(window_size, channel): _1D_window = gaussian(window_size, 1.5).unsqueeze(1) _2D_window = _1D_window.mm(_1D_window.t()).float().unsqueeze(0).unsqueeze(0) window = Variable(_2D_window.expand(channel, 1, window_size, window_size).contiguous()) return window def ssim(img1, img2, window, window_size, channel): mu1 = F.conv2d(img1, window, padding = window_size//2, groups = channel) mu2 = F.conv2d(img2, window, padding = window_size//2, groups = channel) mu1_sq = mu1.pow(2) mu2_sq = mu2.pow(2) mu1_mu2 = mu1*mu2 sigma1_sq = F.conv2d(img1*img1, window, padding = window_size//2, groups = channel) - mu1_sq sigma2_sq = F.conv2d(img2*img2, window, padding = window_size//2, groups = channel) - mu2_sq sigma12 = F.conv2d(img1*img2, window, padding = window_size//2, groups = channel) - mu1_mu2 C1 = (0.01)**2 C2 = (0.03)**2 ssim_map = ((2*mu1_mu2 + C1)*(2*sigma12 + C2)) / ((mu1_sq + mu2_sq + C1)*(sigma1_sq + sigma2_sq + C2)) return ssim_map.mean() def ms_ssim(img1, img2, window_size=11, channel=1): weights = torch.FloatTensor([0.0448, 0.2856, 0.3001, 0.2363, 0.1333]) # 权重 levels = weights.size(0) msssim = [] for _ in range(levels): ssim_map = ssim(img1, img2, window, window_size, channel) msssim.append(ssim_map) img1 = F.avg_pool2d(img1, (2, 2)) img2 = F.avg_pool2d(img2, (2, 2)) msssim = torch.stack(msssim, dim=0) return torch.prod(msssim.pow(weights)) ``` 最后,我们可以使用以上函数计算两个图像的MS-SSIM相似度: ```python img1 = torch.tensor(...) # 输入第一个图像 img2 = torch.tensor(...) # 输入第二个图像 window_size = 11 # 窗口大小,可调整 channel = 3 # 图像通道数 window = create_window(window_size, channel).to(img1.device) similarity = ms_ssim(img1, img2, window_size, channel) ``` 以上就是使用PyTorch实现MS-SSIM相似度计算的方法。希望能对你有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值