全连接层和卷积层实际上是可以相互转换的
1、卷积层替换全连接层的可行性
*、卷积层是局部连接
*、它的特点是稀疏连接和权值共享,
*、全连接是全局信息
2、全连接层到卷积层的转换
、卷积核大小和输入特征图尺寸相同
、保证卷积后运算结果和之前全连接是一样的
转换方法:
通常这种做法是用全局池化(global_pool)和1X1的卷积核实现的,全局池化是不需要设置filter,无论特征图多大都只保留一个。假设batch-size是1,最后的卷积层输出大小是5X5,通道数是512,那么接一个全局池化后卷积层的输出就从5X5,变成了1X1(这也是一种正则化的手段),通道数还是512。这个1X1X512的矩阵和1X1的卷积核做卷积运算,其效果就等于全连接层,但是由于全局池化的存在,所以可以不固定输入模型的图像大小,因为最后全局池化后都会是1X1。这样就可以让训练集和测试集输入模型的图像大小不一致。
代码是通过reduce_mean实现全局池化,[1,2]是表示在图像的高度和宽度这两个维度。(如果是[1,2,3]就表示在图像的高度、宽度和通道数这三个维度)代码也是池化+1X1卷积层的思想来作为全连接层,但是用的是传统池化层而不是全局池化,池化层的filter大小是7X7,是因为上一层的卷积层输出的大小是7X7X1024,所以本质上效果等于全局池化,池化完的大小就是1X1X1024。不过这样的写法就导致GoogleNet的图像输入大小是固定的,只能是224X224,才会正好使最后一个卷积层的高度和宽度都是7。