FCN算法简介
全卷积神经网络FCNet(Long, J, Shelhamer, E, Darrell, T. Fully convolutional networks for semantic segmentation)的输出是与输入图像相对应的一系列热度图(heat map),热度图数目和类别数目一致,每一张热度图的像素值代表图像中对应像素所属这个类别的概率。因此全卷积神经网络是与场景标注相适应的端到端的网络。
如图所示,FCNet的网络结构与AlexNet的结构十分相似,但是各层的输入输出却截然不同。FCNet可以输入任意大小的图像,各层的输出也是一张图像,有利于网络对图像的全局理解。而AlexNet 只能输入指定大小的图像,同时全连接层的输出是向量。这是由于FCNN 的核心思想是将传统DCNN 网络的全连接层更换为卷积核大小为1x1 的卷积层,使得网络中所有含参数的神经元层都是卷积层,从而允许输入任意大小的图像。此外,如果输出是二维图像,输入图像的空间信息将会很好地被保留下来。如图FCNet 的结果不仅将猫识别出来,还将猫的形状、大小和位置等信息一并展现出来。
FC结构
1、全卷积网络特征提取
这部分网络的作用是提取图像的本质特征,按照卷积核大小和输出特征图数目不同可以分为8 组,步长均为1,激活函数为ReLU。前五组的特征图数目分别为64、128、256、512、512,包含的卷积核大小均为3x3。每次卷积之前,都会对输入图像进行填补操作(pad)&#