三、图像分割的模型
1. FCN
FCN(Fully Convolutional Networks),全卷积网络,2015年发表,算是深度学习图像分割模型的鼻祖。
其核心思想为:
- 使用不包含全连接的全卷积网络,所以可以输入任意大小的图片。
- 使用跳跃连接,以结合不同尺度的图像特征,使得模型具备更高的精度与鲁棒性。
- 使用反卷积对提取后的低分辨率图像进行上采样,输出与原图同分辨率的分割图片,保留了原始图像的空间信息,从而能够对原图的每一个像素都进行预测。
其基本网络模式为:
![](https://i-blog.csdnimg.cn/blog_migrate/86abe1269aa2b823b480292928a397e3.png)
论文中采用了经典分类网络:
- AlexNet
- VGGNet
- GoogLeNet
比如下面这个由AlexNet修改(BackBone的特征提取部分)而来的模型结构(PASCAL数据集,20类目标+背景=21):