[一起学习pytorch吧]之pad函数

最新推荐文章于 2024-08-09 15:25:17 发布

missyoudaisy

最新推荐文章于 2024-08-09 15:25:17 发布

阅读量8.4k

点赞数 5

分类专栏：一起学习pytorch

原文链接：https://pytorch.org/docs/stable/nn.functional.html#torch.nn.functional.pad

版权

一起学习pytorch 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

主要翻译的是pytorch官网的文件：https://pytorch.org/docs/stable/nn.functional.html#torch.nn.functional.pad

pad

torch.nn.functional.pad(input, pad, mode='constant', value=0)

ps：有的作者的脚本里写F.pad（前面torch.nn.functional部分在脚本开头import as F了）

padding size

用于填充输入（input）的不同维度的填充尺寸（padding size）是从最后一个维度依次向前描述的。输入（input）的 $\left \lfloor \frac{len\left ( pad \right ) }{2}\right \rfloor$ 维将会被填充。举个栗子，如果仅填充输入张量（tensor）的最后一个维度，填充的形式为(padding_left,padding_right);如果输入张量的最后两个维度，使用(padding_left,padding_right,padding_top,padding_bottom);如果输入张量的最后三个维度，使用(padding_left,padding_right,padding_top,padding_bottom,padding_front,padding_back)。

padding mode

有三个mode：Constant、Replicate和Reflect。Constant模式用于任意维度的填充，Replicate模式用于5D输入张量最后三维或4D输入张量最后两维或3D输入张量最后一维的填充，Reflect模式用于4D输入张量最后两维或3D输入张量的最后一维的填充。

下面详细讲一下三种模式的应用：

（1）CLASS torch.nn.ConstantPad2d(padding,value)

作用：用常值填充输入张量的边界。
对于N维的填充，使用torch.nn.functional.pad()
参数：padding (python:int, tuple) – 填充的尺寸。如果是int型的，对所有的边界使用相同的填充方式。如果是4维的数组，使用(padding_left,padding_right,padding_top,padding_bottom)。
形式：1）输入： $\left ( N,C,H_{in},W_{in}\right )$

2) 输出： $\left ( N,C,H_{out},W_{out}\right )$ ，其中 $\left (H_{out}=H_{in}+padding\: top+padding\: bottom\right )$ , $\left (W_{out}=W_{in}+padding\: left+padding\: right\right )$

例子
>>> m = nn.ConstantPad2d(2, 3.5)
>>> input = torch.randn(1, 2, 2)
>>> input
tensor([[[ 1.6585,  0.4320],
         [-0.8701, -0.4649]]])
>>> m(input)
tensor([[[ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000,  3.5000],
         [ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000,  3.5000],
         [ 3.5000,  3.5000,  1.6585,  0.4320,  3.5000,  3.5000],
         [ 3.5000,  3.5000, -0.8701, -0.4649,  3.5000,  3.5000],
         [ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000,  3.5000],
         [ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000,  3.5000]]])
>>> # using different paddings for different sides
>>> m = nn.ConstantPad2d((3, 0, 2, 1), 3.5)
>>> m(input)
tensor([[[ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000],
         [ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000],
         [ 3.5000,  3.5000,  3.5000,  1.6585,  0.4320],
         [ 3.5000,  3.5000,  3.5000, -0.8701, -0.4649],
         [ 3.5000,  3.5000,  3.5000,  3.5000,  3.5000]]])
（2）CLASS torch.nn.ReflectionPad2d(padding)

作用：用输入的边界做映射（镜像）来进行填充。
对于N维的填充，使用torch.nn.functional.pad()
参数：padding (python:int, tuple) – 填充的尺寸。如果是int型的，对所有的边界使用相同的填充方式。如果是4维的数组，使用(padding_left,padding_right,padding_top,padding_bottom)。
形式：1）输入： $\left ( N,C,H_{in},W_{in}\right )$

2) 输出： $\left ( N,C,H_{out},W_{out}\right )$ ，其中 $\left (H_{out}=H_{in}+padding\: top+padding\: bottom\right )$ , $\left (W_{out}=W_{in}+padding\: left+padding\: right\right )$

例子
>>> m = nn.ReflectionPad2d(2)
>>> input = torch.arange(9, dtype=torch.float).reshape(1, 1, 3, 3)
>>> input
tensor([[[[0., 1., 2.],
          [3., 4., 5.],
          [6., 7., 8.]]]])
>>> m(input)
tensor([[[[8., 7., 6., 7., 8., 7., 6.],
          [5., 4., 3., 4., 5., 4., 3.],
          [2., 1., 0., 1., 2., 1., 0.],
          [5., 4., 3., 4., 5., 4., 3.],
          [8., 7., 6., 7., 8., 7., 6.],
          [5., 4., 3., 4., 5., 4., 3.],
          [2., 1., 0., 1., 2., 1., 0.]]]])
>>> # using different paddings for different sides
>>> m = nn.ReflectionPad2d((1, 1, 2, 0))
>>> m(input)
tensor([[[[7., 6., 7., 8., 7.],
          [4., 3., 4., 5., 4.],
          [1., 0., 1., 2., 1.],
          [4., 3., 4., 5., 4.],
          [7., 6., 7., 8., 7.]]]])
（3）CLASS torch.nn.ReplicationPad2d(padding)

作用：用输入边界的复制来进行填充。
对于N维的填充，使用torch.nn.functional.pad()
参数：padding (python:int, tuple) – 填充的尺寸。如果是int型的，对所有的边界使用相同的填充方式。如果是4维的数组，使用(padding_left,padding_right,padding_top,padding_bottom)。
形式：1）输入： $\left ( N,C,H_{in},W_{in}\right )$

2) 输出： $\left ( N,C,H_{out},W_{out}\right )$ ，其中 $\left (H_{out}=H_{in}+padding\: top+padding\: bottom\right )$ , $\left (W_{out}=W_{in}+padding\: left+padding\: right\right )$

例子
>>> m = nn.ReplicationPad2d(2)
>>> input = torch.arange(9, dtype=torch.float).reshape(1, 1, 3, 3)
>>> input
tensor([[[[0., 1., 2.],
          [3., 4., 5.],
          [6., 7., 8.]]]])
>>> m(input)
tensor([[[[0., 0., 0., 1., 2., 2., 2.],
          [0., 0., 0., 1., 2., 2., 2.],
          [0., 0., 0., 1., 2., 2., 2.],
          [3., 3., 3., 4., 5., 5., 5.],
          [6., 6., 6., 7., 8., 8., 8.],
          [6., 6., 6., 7., 8., 8., 8.],
          [6., 6., 6., 7., 8., 8., 8.]]]])
>>> # using different paddings for different sides
>>> m = nn.ReplicationPad2d((1, 1, 2, 0))
>>> m(input)
tensor([[[[0., 0., 1., 2., 2.],
          [0., 0., 1., 2., 2.],
          [0., 0., 1., 2., 2.],
          [3., 3., 4., 5., 5.],
          [6., 6., 7., 8., 8.]]]])

注意：当使用CUDA时，上述操作可能会在反向计算的过程中带来不确定的结果，并且这种影响是无法停止的。

parameters

input (Tensor) – N维 tensor。

pad (tuple，数组) – m个元素的数组, 其中 $\frac{m}{2}<$ 输入的维度，m是偶数。

mode – 'constant', 'reflect', 'replicate' or 'circular'. 默认值: 'constant'。

value – 'constant'模式下的填充值.。默认值: 0

例子

>>> t4d = torch.empty(3, 3, 4, 2)
>>> p1d = (1, 1) # pad last dim by 1 on each side
>>> out = F.pad(t4d, p1d, "constant", 0)  # effectively zero padding
>>> print(out.data.size())
torch.Size([3, 3, 4, 4])
>>> p2d = (1, 1, 2, 2) # pad last dim by (1, 1) and 2nd to last by (2, 2)
>>> out = F.pad(t4d, p2d, "constant", 0)
>>> print(out.data.size())
torch.Size([3, 3, 8, 4])
>>> t4d = torch.empty(3, 3, 4, 2)
>>> p3d = (0, 1, 2, 1, 3, 3) # pad by (0, 1), (2, 1), and (3, 3)
>>> out = F.pad(t4d, p3d, "constant", 0)
>>> print(out.data.size())
torch.Size([3, 9, 7, 3])