关于FCN的一些理解
第一次写博客,欢迎大家在下方留言批评指正;原文链接:http://arxiv.org/abs/1411.4038
代码链接:code-caffe code-tensorflow code-Pytorch
介绍
因为我研究的是语义分割方向,所以第一篇笔记还是写给深度学习应用于语义分割领域的开山之作,全卷积神经网络吧!
在深度学习应用到计算机视觉领域之前,研究人员一般使用纹理基元森林(TextonForest)或是随机森林(Random Forest)方法来构建用于语义分割的分类器。
深度学习技术在各种高级视觉任务上取得了巨大的成功,尤其是监督方法如卷积神经网络CNN用于图像分类或物体检测 ,推动了语义分割方向的发展。
这些深度学习技术区别于传统方法的关键优势:其强大的针对当前问题学习合适的特征表示的能力。
例如,对于一个特定数据集的像素级标注问题,其使用一种端对端的方法而不是手工设计的特征,而手工设计特征需要领域专门知识、耗时耗力而且有时太过精细化以致于只能在某个特定的场景下使用。
2014年,加州大学伯克利分校的Long等人提出的完全卷积网络(Fully Convolutional Networks),推广了原