Multi-scale Interactive Network for Salient Object Detection(阅读记录)

Multi-scale Interactive Network for Salient Object Detection

1.主要贡献

•文章提出了MINet,以有效地满足SOD任务中的多尺度要求。 聚集相互作用模块可以通过相互学习的方式有效地利用相邻层的特征,而自交互模块则使网络可以自适应地从数据中提取多尺度信息,并更好地处理显著物体的尺度变化。
•文章设计了增强一致性损失函数作为辅助来推动模型一致地突出显示整个显着区域,并更好地处理由各种比例的物体引起的前后区域之间的像素不平衡问题,而无需任何后处理或 额外的参数。

2.模型概括

        整个模型的结构采用的是FCN的网络结构,上面为编码器,下面时解码器,可见,该结构的独特之处在于,添加了AIM、SIM模块来获得多尺度信息,之前的方法获取多尺度的方法多考虑从使用不同空洞率的卷积入手,如ASPP结构,但是这种操作不仅会使得参数量增加,而且作者认为强行concat各种尺度的图片可能会带来噪音,作者强调引用相邻尺度的图片来扩大感受野可能更好,而且编码器解码器本身就有多尺度的信息,用多余操作执行可能导致冗余,因此,本文作者设计了AIM结构融合编码器的相邻尺度的特征来解决多尺度问题。此外,作者还提出SIM结构来提取多尺度信息。

        AIM设计第一列考虑做pooling操作,第二列卷积操作并改变channel,然后就是特征组合,最后卷积处理然后再组合,为了强调当前层的特征,会有一个类似残差的操作。

 

3.损失函数

        作者认为,单纯的BCEloss是有问题的,比如说前景物体与背景的比例变化,BCE对待前景和背景是没有区别的,这都是不太合理的,作者考虑一个更具有表达力的损失函数,应该在结果与预测值前景相差较大时得到最大损失,因此考虑从CEL入手。

 

4.实验结果

 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值