1 摘要
本文基于ReNet提出ReSeg网络,ReSeg网络的特征提取阶段(编码器阶段)采用的是预训练好的CNN网络结构,而在恢复图像尺寸的时候(解码器阶段,也就是上采样阶段)采用了RNN结构,RNN结构部分是基于ReNet的,ReNet是基于RNN的图像分类网络。ReSeg结构处理语义分割任务非常灵活、高效,引入的ReNet模块能够更好地整合上下文信息,达到很好的效果。ReSeg结构在Weizmann Horse数据集、Oxford Flower数据集、和CamVid数据集均达到最好的效果。有关ReNet网络的介绍可以参考我的另一篇文章:
论文笔记:ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks
2 亮点
2.1 ReNet结构改进
ReNet结构是如下图模样,注意ReNet结构图中的各个16x16,8x8,4x4等模块应该画成不同大小的,这里画成了同一尺寸。
而下图则是R