思想: 对于输出的每一个通道的特征图的所有像素计算一个平均值,经过全局平均池化之后就得到一个 维度==类别数 的特征向量,然后直接输入到softmax层
作用: 代替全连接层,可接受任意尺寸的图像
优点: 1)可以更好的将类别与最后一个卷积层的特征图对应起来(每一个通道对应一种类别,这样每一张特征图都可以看成是该类别对应的类别置信图)
2)降低参数量,全局平均池化层没有参数,可防止在该层过拟合 3)整合了全局空间信息,对于输入图片的spatial
translation更加鲁棒
疑惑:
全局池化是放在最后一层,或者一些neck层的,
本应在这个地方出现全连接层或者1*1卷积层,但是改成全球池化了。
这样做少了参数岂不是前面机器学的那么多数字,都被一个粗暴的平均白费了?
查了一些资料,得到答案如下,如果理解有问题请指正,
全局池化就是把一个区域变成一个数 在机器看来 这一个区域都是代表一件事的
比如是不是兔子 其实这一个区域都是代表是兔子的概率
而且比如机器人为是兔子 那这个区域所有值都很大
那为啥不直接弄一个值 要先弄一堆再平均呢
值多泛化能力强 比如 这个是0.8那个是0.9
如果只有一个值 机器必须算出一个数
影响发挥
大概是这个意思