FC和GAP的区别

最新推荐文章于 2024-02-29 11:23:57 发布

王师北

最新推荐文章于 2024-02-29 11:23:57 发布

阅读量1.5k

点赞数

分类专栏： ReID行人重识别

原文链接：https://blog.csdn.net/heshuting555/article/details/90116149?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2

版权

ReID行人重识别专栏收录该内容

27 篇文章 16 订阅

订阅专栏

看reid的论文会发现，作者一般都会提一句话：为了使得能够任意图片大小输入，我们增设了全局平均池化层（GAP）。那为什么全局平均池化可以代替FC呢？全连接层有一个非常致命的弱点就是参数量过大，特别是与最后一个卷积层相连的全连接层。比如，第一个全连接层FC1有4096个节点，上一层feature map是7X7X512 = 25088个节点，则该传输需要4096*25088个权值，需要耗很大的内存。
在这里插入图片描述
这两者合二为一的过程我们可以探索到GAP的真正意义是:对整个网路在结构上做正则化防止过拟合。其直接剔除了全连接层中黑箱的特征，直接赋予了每个channel实际的类别意义。做法是在最后卷积层输出多少类别就多少map，然后直接分别对map进行平均值计算得到结果最后用softmax进行分类。
pytorch代码是：

model.avgpool = nn.AdaptiveAvgPool2d(1)

nn.AdaptiveAvgPool2d参数一般都设成1，这样连FC都不用接啦，也有很多论文是设置成指定大小，后面再接一个FC也是可以呢。但GAP的优点就在于，你无须管输入图像的大小，只需要通过GAP变成指定大小与FC相连即可。比如下面这种错误出现的原因就是因为fc层weight参数维数与输入图像的维数不匹配，
“RuntimeError: size mismatch, m1: [1 x 7744], m2: [400 x 120]” in the convolutional layer . 要解决这种问题有两种办法。1.在FC层前加上GAP变成之前网络FC层前feature map大小。2.改成原来网络的大小