请慎用torch.nn.Upsample

版本:torch==1.12.1

计算机视觉算法中的上采用函数,一般都是采用nearest这种简单模式进行,PyTorch也是有相应的模块`nn.Upsample`来支持。但这个模块实在是不太与时俱进,慎用!

1. 不支持bf16

RuntimeError: "upsample_nearest2d_out_frame" not implemented for 'BFloat16'

2. nn.Upsample 导致模型可复现性变差

参考这里

---

解法就是,自定义Upsample模块,这里也是参考了这里

import torch.nn as nn
class UpsampleDeterministic(nn.Module):
    def __init__(self,upscale=2):
        super(UpsampleDeterministic, self).__init__()
        self.upscale = upscale

    def forward(self, x):
        '''
        x: 4-dim tensor. shape is (batch,channel,h,w)
        output: 4-dim tensor. shape is (batch,channel,self.upscale*h,self.upscale*w)
        '''
        return x[:, :, :, None, :, None]\
        .expand(-1, -1, -1, self.upscale, -1, self.upscale)\
        .reshape(x.size(0), x.size(1), x.size(2)\
                 *self.upscale, x.size(3)*self.upscale)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: torch.nn.functional.upsamplePyTorch中的一个函数,用于对输入进行上采样操作。上采样是一种将输入图像或特征图放大的操作,可以增加图像的分辨率或特征图的大小。该函数支持多种上采样方法,包括最近邻插值、双线性插值和三次样条插值等。在深度学习中,上采样通常用于图像分割、目标检测和语义分割等任务中。 ### 回答2: torch.nn.functional.upsamplePyTorch中的一个函数,用于对输入张量进行上采样操作。上采样是一种将低分辨率图像或数据扩展到高分辨率的过程。这个函数可以根据输入张量的大小和目标尺寸,以及上采样的模式来调整输入数据的大小。 upsample函数最常用的模式是"nearest"(最近邻插值),它会将每个目标像素的值设置为源图像中最接近它的像素的值。此外,还可以使用"bilinear"(双线性插值)模式来进行上采样。在使用双线性插值模式时,函数会根据每个目标像素周围的4个最接近位置的像素,通过进行加权平均来计算目标像素的值。 如果输入张量的尺寸是(N, C, H, W),其中N是批次大小,C是通道数,H是原始高度,W是原始宽度,那么通过upsample函数,可以将输入张量的尺寸调整为(N, C, scale_factor * H, scale_factor * W),其中scale_factor是上采样的缩放因子。上采样时,函数会根据指定的模式对输入张量的每个通道进行上采样操作。 此外,upsample函数还可以通过设置align_corners参数来决定是否对齐像素的角点。当align_corners为真时,输入和输出的角点像素将完全对齐,而当align_corners为假时,角点像素可能会略有偏移。 总而言之,torch.nn.functional.upsample是一个灵活的函数,可以根据指定的模式和参数对输入张量进行上采样操作,以实现图像或数据的尺寸调整和分辨率提升。 ### 回答3: torch.nn.functional.upsamplePyTorch库中的一个函数,用于对输入进行上采样操作。上采样是一种将低分辨率图像或数据增大到高分辨率的过程,常用于图像处理和计算机视觉任务中。 torch.nn.functional.upsample函数可以用于2D和3D的数据上采样。它接受输入数据和输出大小作为参数,并返回经过上采样处理后的输出。具体来说,它通过插值算法将输入数据的每个像素或元素进行变换和填充,从而生成更大的输出数据。 torch.nn.functional.upsample函数的常用插值方法包括最近邻插值、双线性插值和三线性插值。最近邻插值方法在上采样过程中利用最近邻的像素值进行填充,保持了图像中原有的纹理和细节。双线性插值方法则通过线性插值计算新像素的值,使得上采样后的图像更加平滑。三线性插值方法则在3D数据上进行插值操作。 使用torch.nn.functional.upsample函数时,需要注意输入数据的型和形状,以及目标上采样大小的指定。通常情况下,输入数据的通道数和目标上采样大小需要保持一致。 综上所述,torch.nn.functional.upsample是一个用于对输入数据进行上采样操作的函数。它通过插值算法将输入数据的像素或元素进行变换和填充,从而生成更大的输出数据。这个函数提供了多种插值方法,可以根据具体任务的需求选择合适的方法进行上采样。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值