代码开源https://github.com/guosheng/refinenet
参考博客
http://blog.csdn.net/melpancake/article/details/54143319
http://blog.csdn.net/bea_tree/article/details/58208386
http://blog.csdn.net/zhangjunhit/article/details/72844862
这篇文章核心创新点在于设计了类似金字塔图像,从原始图像的多个尺度来提取不同尺度的特征,最后通过设计多路径细化的结构将不同尺度的特征map进行融合,从而将粗糙的高层语义特征和细粒度的低层特征融合。同时网络的实现上也采用了残差网络的快捷连接的结构,从而有助于网络梯度的传播,有效地训练网络。
文章的核心就是"Exploit multi-level features for high-resolution prediction with long-range residual connections."
1 Introduction
直接将 CNN 网络模型如 VGG 、Residual Net 用于语义分割存在的问题就是 CNN 卷积池化得到的特征图是降采样