Reverse Attention-Based Residual Network for Salient Object Detection论文解读以及代码复现时所遇问题

论文原文下载:原文
代码下载:源代码

该博客只是在学习本篇论文时自己所遇问题以及一些心得,如有侵权,请联系本人删除即可。

该论文主要针对的是SOD遇到的一些问题,如:模型架构复杂、模型参数较多的问题,作者提出了一种框架即:Reverse Attention-Based Residual Network。

前述部分作者讲的很仔细,我就不多赘述,只进行模型的讲解。

Initial Saliency Prediction

首先经过VGG-16进行处理,因为VGG16独特的网络框架,具有五个最大池化层,因此在每个池化层处引出五个不同尺寸大小的侧输出。论文将最后一个池化层的输出称为initial saliency,作者首先对initial saliency进行处理:通过一个1*1的卷积层将输出将成维度为64的输出。并且设计了一个多尺度上下文模块(MSCM)用来捕获全局显著性线索。MSCM分为两部分:一是(2b-1)x(2b-1)尺寸的卷积核进行卷积,另一个是核尺寸为3x3输出为2(b-1)的卷积核进行卷积。最后将四个分支进行融合,并通过一个3x3的卷积生成单通道的输出预测,生成结果只有输入图片的1/32.

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值