全卷积网络(Fully Convolutional Networks,FCN)是UC Berkeley的Jonathan Long等人于2015年在Fully Convolutional Networks for Semantic Segmentation一文中提出的用于图像语义分割的一种框架。第一个端到断图像分割神经网络。
端到端通俗解释:
直接输入数据,中间数据处理过程不管,输出即为我们想要的结果。
FCN全卷积积特点:
- 卷积化(Convolutional):网络在CNN卷积部分不用全连接而是替换成卷积的目的是允许输入的图片为超过某一尺寸的任意大小。
- 上采样(Upsample,使用反卷积。)
- 跳跃结构(Skip Layer)
网络结构:
跳级结构 Skips:
将底层(stride 32)的预测(FCN-32s)进行2倍的上采样得到原尺寸的图像,并与从pool4层(stride 16)进行的预测融合起来(相加),这一部分的网络被称为FCN-16s。随后将这一部分的预测再进行一次2倍的上采样并与从pool3层得到的预测融合起来,这一部分的网络被称为FCN-8s。对第5层的输出执行32倍的反卷积得到原图,得到的结果不是很精确,论文中同时执行了第4层和第3层输出的反卷积操作(分别需要16倍和8倍的上采样),再把这3个反卷积的结果图像融合,提升了结果的精确度
最后像素的分类按照该点在1000张上采样得到的图上的最大的概率来定。