【机器学习】下采样 (Downsampling)

最新推荐文章于 2025-03-28 00:22:18 发布

LOST P

最新推荐文章于 2025-03-28 00:22:18 发布

阅读量4.4k

点赞数 10

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/fzy2003/article/details/142177145

版权

13 篇文章

订阅专栏

下采样 (Downsampling) 是指在深度学习和信号处理中，将数据的空间分辨率降低、减少数据量的过程。在图像处理中，下采样意味着减少图像的宽度和高度（即减少像素数量），从而压缩数据量。

下采样的主要目的是减小计算量、增加感受野，并通过降低特征图的分辨率来提取更加抽象的高层次特征。

在卷积神经网络（CNN）中，下采样常用于在深层网络中逐渐减小输入的尺寸，帮助网络从局部特征转向更大的上下文或全局特征。

池化层（Pooling）：
- 最大池化（Max Pooling）：在每个池化窗口中选取最大值作为输出值。例如，使用 2x2 最大池化会将 4 个像素中的最大值作为新的像素值，从而减小特征图尺寸。
- 平均池化（Average Pooling）：在池化窗口中计算平均值作为输出值。与最大池化不同，平均池化关注整个窗口的平均信息。
卷积层下采样：
- 使用卷积层下采样是通过卷积层的步幅（stride > 1）来减小特征图的空间分辨率。例如，使用 stride=2 的卷积操作会将特征图的宽度和高度减半。
- 这种方式不仅进行下采样，还会通过卷积操作提取特征。
跳跃连接中的下采样：
- 在一些架构中（如 ResNet），可以通过跳跃连接中的卷积操作进行下采样，这种方式允许在缩小分辨率的同时保留较多信息。

ConvNeXt 通过卷积操作进行下采样，而不是传统的池化层。代码中使用 stride=2 的卷积进行下采样，这种方法不仅实现了分辨率的降低，还能通过卷积核学习特征，保留更多信息：

nn.Conv2d(in_chans, dims[0], kernel_size=4, stride=4)  # 下采样，步幅为4