11.1学习笔记——池化

1、池化

池化是缩小高、长方向上的空间的运算。以下图为例:

图1 Max池化处理顺序

        对图1左侧的数字按照stride=2进行2*2的Max池化是的处理顺序。其中"Max池化"是获取最大值的运算,“2*2”表示目标区域的大小。右侧图像中是取出了每个2*2区域中的最大元素。将stride设置成2,每次移动间隔就为2。一般情况下会将池化窗口设置成和步幅大小一致。

        除Max池化之外,还有Average池化等,Average池化是计算目标区域内的平均值,在图像识别领域中一般就是使用Max池化。

池化层的特征

        没有要学习的参数

        池化层和卷积层不同,没有需要学习的参数,池化只是从目标区域中取最大值(平均值),因此不存在要学习的过程。

        通道数不发生变化

        经过池化运算,输入数据和输出数据的通道数不会发生变化。

图2 池化中通道数不变

        对于微小的位置变化具有鲁棒性(健壮)   

        输入数据发生微小变化时,池化仍会返回相同的结果,所以池化操作具有很强的鲁棒性。

2、卷积层于池化层的实现

        CNN中各层之间传递的数据是4维数据,就好比输入一个数据的形状是(10,1,28,28),则其对应着10个高为28,长为28,通道为1的数据。

import numpy as np
x = np.random.randn(10,1,28,28) #
t = x.shape
print(t)

基于im2col的展开         

        im2col在卷积运算中起着重要的作用。如果老老实实的实现卷积运算,需要重复好几层的for语句,这样的实现就有点麻烦,且Numpy中存在使用for语句后处理速度会变慢的缺点。所以使用im2col这个便利的函数进行运算。

        im2col是一个函数,将输入数据展开以适合滤波器(权重),对三维的输入数据应用im2col后,数据就会展开为二维矩阵(将包含批数量的4维数据转换成了2维数据)。

图3 im2col的示意图

        im2col会把输入数据展开以适合滤波器,对于输入数据,将应用滤波器的区域(3维方块)横向展开为1列。im2col会在所有应用滤波器的地方进行展开处理。 

图4 将滤波器的应用区域从头开始依次横向展开为1列

        在实际的卷积操作中,滤波器的应用区域几乎都是重叠的,在滤波器重叠的的情况下,使用im2col展开后没展开后的元素会多于原来的元素个数。 因此,使用im2col的实现存在比普通的实现消耗更多内存的缺点。但同时,汇总成一个大的矩阵进行计算,对计算机的计算很有益处。

图5 卷积运算的滤波器处理的细节

卷积层的实现 

        im2col函数作为黑盒(不关心内部实现)使用。im2col的实现实质上是一个10行左右的简单函数。

利用im2col实现卷积层:

class convolution:
    def __init__(self, W, b, stride=1, pad=0):
        self.W = W
        self.b = b
        self.stride = stride
        self.pad = pad
        
    def forward(self, x):
        FN, C, FH, FW = self.W.shape
        N, C, H, W = x.shape
        out_h = int(1 + (H + 2 * self.pad - FH) / self.stride)
        out_w = int(1 + (W + 2 * self.pad - FW) / self.stride)
        
        col = im2col(x, FH, FW, self.stride, self.pad)
        col_W = self.W.reshape(FN, -1)
        out = np.dot(col, col_W) + self.b
        out = out.reshape(N, out_h, out_w , -1)

        卷积层初始化方法将滤波器(权重)、偏置、步幅、填充作为参数接收。滤波器是(FN,C,FH,FW)的4维形状。FN,C,FH,FW分别是滤波器数量、通道数、滤波器的高、滤波器的宽。

col = im2col(x, FH, FW, self.stride, self.pad)
col_W = self.W.reshape(FN, -1)
out = np.dot(col, col_W) + self.b

这一部分是卷积层实现中的重要部分,这里用im2col展开输入数据,并用reshape将滤波器展开为2维数组,计算展开后的矩阵的乘积。reshape(FN, -1)将参数指定为-1,这时reshape的一个便利的功能。指定reshape为-1,reshape函数会自动计算-1维度上的元素个数,以使多维数组的元素个数前后一致。(10, 3, 5, 5)形状的数组的元素个数共有750个,指定reshape(10, -1)后,就会转换成(10,75)形状的数组。

        forward的实现中,最后会将输出大小转换为合适的形状。转换时使用了transpose函数。transpose会更改多维数组的轴的顺序。

池化层的实现

        池化层的实现与卷积层相同,都使用im2col展开输入数据。但是池化在通道上是独立的这一点与卷积层不同。

图5 对输入数据展开池化的应用区域
图6 池化层的实现流程:最大值元素用灰色表示

        python代码实现:

class Pooling:
    def __init__(self, pool_h, pool_w, stride=1, pad=0):
        self.pool_h = pool_h
        self.pool_w = pool_w
        self.stride = stride
        self.pad = pad
        
    def forward(self, x):
        N, C, H, W = x.shape
        out_h = int(1 + (H - self.pool_h) / self.stride)
        out_w = int(1 + (W - self.pool_w) / self.stride)
        # 展开
        col = im2col(x, self.pool_h, self.pool_w, self.stride, self.pad)
        col = col.reshape(-1, self.pool_h*self.pool_w)
        # 最大值
        out = np.max(col, axis=1)
        # 转换
        out = out.reshape(N, out_h, out_w, C).transpose(0, 3, 1, 2)
        return out

池化步骤

1、展开输入数据 

2、求各行的最大值

3、转换为合适的输出大小

 未完...

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要在Linux上安装CUDA 11.1,可以按照以下步骤进行操作: 1. 首先,下载CUDA 11.1安装文件。可以使用以下命令下载安装文件: ``` wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run ``` 2. 下载完成后,运行以下命令以执行安装程序: ``` sudo sh cuda_11.1.0_455.23.05_linux.run ``` 3. 在安装过程中,会出现一个选择页面。如果之前已经安装过CUDA并且不需要安装驱动程序,请取消选中"Driver"选项。然后继续安装。 4. 安装完成后,打开终端并编辑配置文件~/.bashrc: ``` vim ~/.bashrc ``` 5. 在配置文件的末尾添加以下两行路径配置: ``` # CUDA Soft Link export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} ``` 6. 保存并退出配置文件。按下Esc键,然后输入:wq并按回车键。 7. 刷新环境变量,使配置生效: ``` source ~/.bashrc ``` 8. 最后,验证CUDA安装情况: ``` nvcc -V ``` 这样就完成了在Linux上安装CUDA 11.1的过程。请确保按照上述步骤进行操作,并根据自己的需求进行相应的配置。 #### 引用[.reference_title] - *1* [Ubuntu18.04系统cuda11.1安装教程](https://blog.csdn.net/DIVINER_Feng/article/details/123159787)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [linux环境 cuda 11.1配置](https://blog.csdn.net/wangmengmeng99/article/details/119349202)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Ubuntu 18.04/20.04 CV环境配置(上):CUDA11.1 + cudnn安装配置](https://blog.csdn.net/hhaowang/article/details/125803582)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值