torch.nn.MaxPool2d()和slim.max_pool2d()函数详解-CSDN博客

本文链接：https://blog.csdn.net/daijingxin/article/details/136770748

本文详细比较了TensorFlow的slim.max_pool2d和PyTorch的torch.nn.MaxPool2d函数，介绍了它们的参数、数据格式和行为，帮助理解这两种库中池化操作的关键概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.slim.max_pool2d()函数

def max_pool2d(inputs,
               kernel_size,
               stride=2,
               padding='VALID',
               data_format=DATA_FORMAT_NHWC,
               outputs_collections=None,
               scope=None):
  if data_format not in (DATA_FORMAT_NCHW, DATA_FORMAT_NHWC):
    raise ValueError('data_format has to be either NCHW or NHWC.')
  with ops.name_scope(scope, 'MaxPool2D', [inputs]) as sc:
    inputs = ops.convert_to_tensor(inputs)
    df = ('channels_first'
          if data_format and data_format.startswith('NC') else 'channels_last')
    layer = pooling_layers.MaxPooling2D(
        pool_size=kernel_size,
        strides=stride,
        padding=padding,
        data_format=df,
        _scope=sc)
    outputs = layer.apply(inputs)
    return utils.collect_named_outputs(outputs_collections, sc, outputs)

1.1 参数：

1.1.1 inputs：

一个形状’ [batch_size, height, width, channels] ‘的4-D张量，如果’ data_format ‘是’ NHWC ‘，那么’ [batch_size, channels, height, width] ‘如果’ data_format ‘是’ NCHW '。

1.1.2 kernel_size：

计算op的池内核的长度2:[kernel_height, kernel_width]的列表。如果两个值相同，则可以是int。

1.1.3 stride：

一个长度为2的列表:[stride_height, stride_width]。如果两个步骤相同，则可以是int。注意，目前这两个步骤必须具有相同的值。

1.1.4 padding：

填充方法，要么“有效”，要么“相同”。

1.1.5 data_forma：

一个字符串。支持’ NHWC ‘(默认值)和’ NCHW '。

1.1.6 outputs_collections：

将输出添加到其中的集合。

1.1.7 scope:

name_scope的可选作用域。

1.2 返回值：

表示池操作结果的“张量”。

2.torch.nn.MaxPool2d()函数

class MaxPool2d(_MaxPoolNd):
    kernel_size: _size_2_t
    stride: _size_2_t
    padding: _size_2_t
    dilation: _size_2_t

    def forward(self, input: Tensor) -> Tensor:
        return F.max_pool2d(input, self.kernel_size, self.stride,
                            self.padding, self.dilation, self.ceil_mode,
                            self.return_indices)