姓名:Jyx
描述:人工智能学习笔记
语义分割:语义分割就是对图片上的每个像素按照其所属的实例类型进行分类。如下图
传统的网络包含pool层,增大感受野,但对应的输出尺寸也会降低,要想做pixelwise prediction,必须保证输出尺寸与原图等大,但原来的结构最后被展开成一维向量丢失了位置信息,FCN替换了最后的全连接层换为CNN,并通过反卷积得到与原图等大的图像,提高精度
FCN模型:
全链接层:
fcn模型是一个比较宽泛的概念,它可基于一个卷积分类网络创建,例如vgg,卷积分类网络的最后几层一般为全连接层,来产生分类输出,fcn提出将全连接层改为全卷积层,以保留更多的位置信息。并通过反卷积提供像素级别的分类预测
跳跃结构
fcn模型还可以通过混合原卷积网络中间层的结果来改善分类性能。卷积网络在各个层的池化过程中感受野越来越大,但相应的位置信息也就越来越模糊,通过加入中间层(更大的size)的结果,可以混合更加精确的位置信息从而改善结果
通过对vgg网络结果层2倍上采样与pool4相加,再16倍上采样得到fcn x16
如果对上述结果两倍上采样与pool3相加,再倍上采样得到fcb x8
条件随机场
另外,在得到结果后,还可以通过条件随机场提高精度