backbone部分 vgg换成了resnet50,并且在backbone中使用到了膨胀卷积
从最开始到layer2和resnet网络是完全一样的
layer3,4有所不同
bottleneck1(对应原来的虚线残差结构)
不同点在于:捷径上卷积核步距改为了1(resnet中会将特征层大小缩小为原来的一半)
因为在语义分割网络中如果下采样的倍率过大,还原回原图效果会受影响,所以这里就没必要下采样了
主干上,第二个卷积层步距也从2该到了1,并且引入了r参数(膨胀系数)
bottleneck2
不同之处在于主干上第二个卷积层使用了膨胀卷积(r参数 )
FCN head模块
通过第一个卷积层后,会将特征层的深度缩小为原来的四分之一
这里最后的1*1卷积层会调整特征层的channel为分类任务中的类别个数
最后再通过双线性插值的方法将其还原为原图大小
从layer3引出的FCN Head(结构和另一个一样)
作用是:防止误差梯度无法传递到网络浅层
所以就引入了一个辅助分类器(和Googlenet中的辅助分类器作用是差不多的)(训练时可用可不用)
预测过程中不会使用这个辅助分类器