cvpr2019
摘要:
问题:分割问题,针对于encoder和decoder
方法:使用data-dependent upsample,可以减少参数量,同时可以融合不同尺度特在,提高准确率
贡献:仅用百分之20的计算量,超越了现在最好的decoder,没有做任何后处理:88.1% mIOU on PASCAL VOC with 30% computation of the previously best model; and 52.5% mIOU on PASCAL Context.
介绍:
1.现在的方法都是由用双线性插值来恢复分辨率,但是这有一个缺点就是,双线性插值没有考虑到像素之间的相关性,因为它是数据无关的(这句话不是很理解,可以看双线性插值是什么?)
2.deeplab v3+的分辨率由32分之一扩大到8分之一(由于孔洞卷积),所以计算量会很大。
3.decoder经常融合特别低分辨率的特征,是由于双线性插值的限制,而导致好的分割结果被低层次的特在所主导(不理解?)
4.为了产生高分辨率的预测,必须在低层次的融入高层次的特征,限制了特征融合的设计空间,我们设计了一个不受特征分辨率限制的融合策略(?)减少了解码器对精确响应的需求
5.同时,由于DUpsampling的有效性,它允许解码器在融合特征映射之前将融合特征下采样到最低分辨率的特征映射,不仅仅减少了计算量,而且分离了融合特征的分辨率和最后一层的准确率,这个分隔,可以允许任意分辨率的特征融合,因此一个更好的特征融合可以促进分割结果。