Reverse Attention-Based Residual Network for Salient Object Detection论文解读以及代码复现时所遇问题

最新推荐文章于 2023-02-13 19:17:38 发布

weixin_45908408

最新推荐文章于 2023-02-13 19:17:38 发布

阅读量1.3k

点赞数 2

分类专栏：代码解读论文解读文章标签： pytorch 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45908408/article/details/108883132

版权

这篇博客介绍了论文'Reverse Attention-Based Residual Network for Salient Object Detection'，该论文针对显著目标检测（SOD）中模型复杂、参数多的问题，提出了一种新的框架。博主详细讲解了初始显著预测、侧输出残差学习和自顶向下逆注意力等关键部分，并分享了在代码实现过程中遇到的问题和解决方法，包括环境配置、预训练模型的获取以及如何修复代码报错等。

摘要由CSDN通过智能技术生成

论文原文下载：原文
代码下载：源代码

该博客只是在学习本篇论文时自己所遇问题以及一些心得，如有侵权，请联系本人删除即可。

该论文主要针对的是SOD遇到的一些问题，如：模型架构复杂、模型参数较多的问题，作者提出了一种框架即：Reverse Attention-Based Residual Network。

前述部分作者讲的很仔细，我就不多赘述，只进行模型的讲解。

Initial Saliency Prediction

首先经过VGG-16进行处理,因为VGG16独特的网络框架，具有五个最大池化层，因此在每个池化层处引出五个不同尺寸大小的侧输出。论文将最后一个池化层的输出称为initial saliency，作者首先对initial saliency进行处理：通过一个1*1的卷积层将输出将成维度为64的输出。并且设计了一个多尺度上下文模块（MSCM）用来捕获全局显著性线索。MSCM分为两部分：一是（2b-1）x（2b-1）尺寸的卷积核进行卷积，另一个是核尺寸为3x3输出为2（b-1）的卷积核进行卷积。最后将四个分支进行融合，并通过一个3x3的卷积生成单通道的输出预测，生成结果只有输入图片的1/32.

最低0.47元/天解锁文章

weixin_45908408

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Reverse Attention-Based Residual Network for Salient Object Detection论文解读以及代码复现时所遇问题

论文原文下载：原文代码下载：源代码该博客只是在学习本篇论文时自己所遇问题以及一些心得，如有侵权，请联系本人删除即可。该论文主要针对的是SOD遇到的一些问题，如：模型架构复杂、模型参数较多的问题，作者提出了一种框架即：Reverse Attention-Based Residual Network。前述部分作者讲的很仔细，我就不多赘述，只进行模型的讲解。Initial Saliency Prediction首先经过VGG-16进行处理,因为VGG16独特的网络框架，具有五个最大池化层，因此在每个池
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。