Multi-scale Interactive Network for Salient Object Detection（阅读记录）

最新推荐文章于 2024-05-15 17:52:25 发布

日月火山

最新推荐文章于 2024-05-15 17:52:25 发布

阅读量2.8k

点赞数 1

分类专栏： SOD 文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SunMoonVocano/article/details/107152409

版权

SOD 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

Multi-scale Interactive Network for Salient Object Detection

1.主要贡献

•文章提出了MINet，以有效地满足SOD任务中的多尺度要求。聚集相互作用模块可以通过相互学习的方式有效地利用相邻层的特征，而自交互模块则使网络可以自适应地从数据中提取多尺度信息，并更好地处理显著物体的尺度变化。
•文章设计了增强一致性损失函数作为辅助来推动模型一致地突出显示整个显着区域，并更好地处理由各种比例的物体引起的前后区域之间的像素不平衡问题，而无需任何后处理或额外的参数。

2.模型概括

整个模型的结构采用的是FCN的网络结构，上面为编码器，下面时解码器，可见，该结构的独特之处在于，添加了AIM、SIM模块来获得多尺度信息，之前的方法获取多尺度的方法多考虑从使用不同空洞率的卷积入手，如ASPP结构，但是这种操作不仅会使得参数量增加，而且作者认为强行concat各种尺度的图片可能会带来噪音，作者强调引用相邻尺度的图片来扩大感受野可能更好，而且编码器解码器本身就有多尺度的信息，用多余操作执行可能导致冗余，因此，本文作者设计了AIM结构融合编码器的相邻尺度的特征来解决多尺度问题。此外，作者还提出SIM结构来提取多尺度信息。

AIM设计第一列考虑做pooling操作，第二列卷积操作并改变channel，然后就是特征组合，最后卷积处理然后再组合，为了强调当前层的特征，会有一个类似残差的操作。

3.损失函数

作者认为，单纯的BCEloss是有问题的，比如说前景物体与背景的比例变化，BCE对待前景和背景是没有区别的，这都是不太合理的，作者考虑一个更具有表达力的损失函数，应该在结果与预测值前景相差较大时得到最大损失，因此考虑从CEL入手。

4.实验结果

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
Multi-scale Interactive Network for Salient Object Detection（阅读记录）

Multi-scale Interactive Network for Salient Object Detection1.主要贡献•文章提出了MINet，以有效地满足SOD任务中的多尺度要求。聚集相互作用模块可以通过相互学习的方式有效地利用相邻层的特征，而自交互模块则使网络可以自适应地从数据中提取多尺度信息，并更好地处理显著物体的尺度变化。•文章设计了增强一致性损失函数作为辅助来推动模型一致地突出显示整个显着区域，并更好地处理由各种比例的物体引起的前后区域之间的像素不平衡问题，而无需任何后处理
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。