论文笔记 FCN: Fully Convolutional Networks for SemanticSegmentation
https://blog.csdn.net/u012905422/article/details/53306818
图像分割=抠图
简单地说,分割就是抠图。语义分割,就是按图像中物体表达的含义进行抠图
2010年前,CNN 是非常高效的视觉处理工具,因为它能够学习到层次化的特征。研究人员将全连接层替换为卷积层来输出一种空间域映射(反卷积)而非简单输出类别的概率,从而将图像分割问题转换为端对端的图像处理问题。
端对端
通俗的讲:在解决问题的时候,输入问题的原始数据,然后模型输出所需结果,中间过程我们不加以考虑,这应该就是端对端最通俗的解释。
浅色部分人参与,深色部分是机器自动完成
端对端的好处:通过缩减人工预处理和后续处理,尽可能使模型从原始输入到最终输出,给模型更多可以根据数据自动调节的空间,增加模型的整体契合度。
端对端的坏处:通过大量模型的组合,增加了模型复杂度,降低了模型可解释性。
发展历程
-
2014年 FCN 模型,主要贡献为在语义分割问题中推广使用端对端卷积神经网络,使用反卷积进行上采样
-
2015年 U-net 模型