SegNet:基于FCN,修改VGG-16网络得到的
正常版SegNet;贝叶斯版SegNet(还根据网络的深度提供了一个basic segnet浅网络)
1.SegNet原始网络模型
对称网络
Encoder:
卷积提取高维特征(same卷积,卷积后不改变图片大小),并通过pooling下采样使图片变小(得到低分辨率的特征图)
Decoder:
反卷积使得图像分类后特征重现(为了丰富信息;是普通的卷积操作,同上)+upsampling上采样使图像变大(得到高分辨率的特征图)
Softmax:
输出不同分类的最大值
1.1Pooling下采样
下采样获得最大值,和相应的位置索引
SegNet中的Pooling多一个index功能,每次Pooling,都会保存通过max选出的权值在2x2 filter中的相对位置,e.g.6在粉色2x2 filter中的位置是(1,1),黄色的3的index是(0,0)
pooling后的pool indices输出到对应的upsampling
1.2Upsampling上采样
Pooling后,每个filter丢失3个权重,并且这些权重无法复原
Upsampling先把输入的特征图放大两倍,然后把输入特征图的数据根据Pooling indices保存的位置放入到对应的索引位置
除了被记住位置的pooling indices,其他位置权值是0:通过反卷积,学习缺失的内容
1.3Output
最后一个卷积层输出所有的类别(包括other类),softmax求出每个像素在所有类别中概率最大的一个,作为该像素的label,最终完成图像像素级别的分类
2.贝叶斯SegNet
先验概率:由原因到结果的推导(缺点:不知道结果的可靠性)
后验概率:从结果寻找原因的贝叶斯概率,可以给出结果的可信程度,即置信度
与SegNet区别:只在卷积层多加了DropOut层
DropOut层:只激活部分神经元,结果是这次迭代的向前和向后传播只有部分权值得到学习,即改变权值。防止权值过度拟合,增强学习能力。