参考:四、全卷积网络FCN详细讲解(超级详细哦)
这篇文章已经写的很好了,这里说两个我考虑的点。
第一个就是:FCN在缩小成heat map,为什么要通过上采样还原回原图大小?
我觉得这个的原因是因为,FCN需要找到原图目标的一个范围,通过放大去找到。比如说,输入是64×64的图像,在缩小到4×4之后,发现最大score在左上角,那么在通过采样后还原的图像,也可以寻找最大值来找到目标区域。
第二个就是:FCN和CNN的主要区别方面
我觉得主要区别不仅仅在于FCN在中间层不需要明确输出的size,重要的是输出方面,CNN要输出一个向量,代表每一类的几率,而FCN输出是一个map或多个map,然后每个map代表一类在map中的几率。而且FCN的输入可以任意大小,而CNN是指定的。