论文相关
发表会议CVPR 2015
作者Jonathan Long ,Evan Shelhamer ,Trevor Darrell (UC Berkeley)
论文地址 link.
简要介绍
文章的目的是构建一个全卷积网络,这个网络能够对任意大小的输入通过有效的推理和学习产生相应大小的输出。
全卷积的网络结构的作用是將深层的粗糙的语义信息与浅层的精细的表面信息结合起来,进行准确和详细的分割。
文章提出这是第一次端到端地训练FCNs,去做1.每个像素点的分类;2.有监督下的预训练。
网络结构和原理
典型的像LeNet,AlexNet这种做识别的网络都是固定的输入大小,然后产生最后的分类结果,结果的输出是非空间的。因为全连接层会把feature map的输入转换成一维的输入,然后去做分类。然而全卷积可以看作是对全连接层的整个输入空间上做卷积,卷积的结果不再是一维的向量而是一张图,称为heatmap。
图片上方是卷积+全连接的结构,输出的预测的数值。图片下方是把全连接改为卷积后的示意图,输出的是一张heatmap。
然后作者定义一种用作分割的全卷积网络。网络结构如下图所示。