interpolate
torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None)
根据给定的size或scale_factor参数来对输入进行下/上采样
使用的插值算法取决于参数mode的设置
支持目前的temporal(1D, 如向量数据), spatial(2D, 如jpg、png等图像数据)和volumetric(3D, 如点云数据)类型的采样数据作为输入,输入数据的格式为minibatch x channels x [optional depth] x [optional height] x width,具体为:
- 对于一个temporal输入,期待着3D张量的输入,即minibatch x channels x width
- 对于一个空间spatial输入,期待着4D张量的输入,即minibatch x channels x height x width
- 对于体积volumetric输入,则期待着5D张量的输入,即minibatch x channels x depth x height x width
可用于重置大小的mode有:最近邻、线性(3D-only),、双线性, 双三次(bicubic,4D-only)和三线性(trilinear,5D-only)插值算法和area算法
参数:
-
input (Tensor) – 输入张量
-
size (int or Tuple[int] or Tuple[int, int] or Tuple[int, int, int]) –输出大小.
-
scale_factor (float or Tuple[float]) – 指定输出为输入的多少倍数。如果输入为tuple,其也要制定为tuple类型
-
mode (str) –
可使用的上采样算法,有
'nearest'
,'linear'
,'bilinear'
,'bicubic'
,'trilinear'和'area'
.默认使用
'nearest'
-
align_corners (bool, optional) –
几何上,我们认为输入和输出的像素是正方形,而不是点。如果设置为True,则输入和输出张量由其角像素的中心点对齐,从而保留角像素处的值。如果设置为False,则输入和输出张量由它们的角像素的角点对齐,插值使用边界外值的边值填充;
当scale_factor保持不变时
,使该操作独立于输入大小。仅当使用的算法为'linear'
,'bilinear', 'bilinear'
or'trilinear'时可以使用。
默认设置为
False
-
输入:
-
import torch from torch import nn import torch.nn.functional as F input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2) input
返回值:
tensor([[[[1., 2.], [3., 4.]]]])
输入:
x = F.interpolate(input, scale_factor=2, mode='nearest') x
返回值
tensor([[[[1., 1., 2., 2.], [1., 1., 2., 2.], [3., 3., 4., 4.], [3., 3., 4., 4.]]]])
输入值:
x = F.interpolate(input, scale_factor=2, mode='bilinear', align_corners=True) x
返回值:
tensor([[[[1.0000, 1.3333, 1.6667, 2.0000], [1.6667, 2.0000, 2.3333, 2.6667], [2.3333, 2.6667, 3.0000, 3.3333], [3.0000, 3.3333, 3.6667, 4.0000]]]])