在最近的学习过程中,发现了一个比较好的框架MMCV,在该框架下对于模型参数等进行调整比较方便,由于我目前的主要学习内容是图像语义分割,因此接下来几天我会对于MMSegmentation里面的每一个模型进行学习并且自己尝试手写模型。
首先第一个就是语义分割的开山鼻祖——FCN,这是第一个在进行下采样后又上采样的模型,开启了传统的编码器解码器模式,下面是FCN的模型图
可以看出FCN对于图像进行下采样到最后, 在上采样的过程中有比较明显的跳跃链接结构,如下图所示
其中:
FCN32s:从conv7中引入信息并调整到合适大小
FCN16s:从conv7 pool4中提取信息,并上采样调整到相同大小进行相加
同理可得出FCN8s