BASNet: Boundary-Aware Salient Object Detection阅读笔记

最新推荐文章于 2023-05-25 15:56:10 发布

Ma lidong

最新推荐文章于 2023-05-25 15:56:10 发布

阅读量999

点赞数

分类专栏：伪装目标检测论文阅读文章标签：人工智能计算机视觉深度学习原力计划

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41684249/article/details/115855042

版权

伪装目标检测论文阅读专栏收录该内容

19 篇文章 69 订阅

订阅专栏

CVPR 2019
Xuebin Qin, Zichen Zhang, Chenyang Huang, Chao Gao, Masood Dehghan, Martin Jagersand
论文地址

一、简介

提出了边界感知显著性目标检测网络（BASNet），它由Predict Module和RRM模块组成，Predict Module模块用于得到粗略的显著性图像，RRM用于克服“coarse”。

提出了一种新的混合损失，融合BCE，SSIM和IoU损失，分别针对pixel-level, patch-level和map-level。

二、BASNet

在这里插入图片描述

2.1 Predict Module

将Predict Module设计为一个编码-解码网络，因为这种体系结构能够同时捕获高级全局上下文信息和低级细节信息。

为了减少过拟合，每个解码器阶段的最后一层受ground truth监督。为实现每个解码器阶段输出显著性图作监督训练，使用上采样和sigmiod得到显著性图。

编码器与解码器之间添加桥接阶段以进一步捕获全局信息。

2.2 Refine Module

RM模块使用残差块的结构，增强了Predict Module输出的“粗糙（coarse）”的显著性图像。

在这里插入图片描述

coarse通常包含两个方面，一个是模糊嘈杂的边界，如fig3的（b）；另一个是不均匀的区域概率，如fig3的（c）。

在这里插入图片描述

RRM_LC模块是最初提出用于边界改进的，然后他的感受野很小；RRM_MS模块使用不同大小的卷积来捕获多尺度上下文信息，但是由于模块很浅，很难捕获更高的细化信息。

为了在显著性图中优化区域和边界的缺点，我们提出了采用残差编码-解码结构的RRM模块，如Fig4的（c）。

2.3 Hybrid Loss

整体损失如下：

在这里插入图片描述

其中，通过对8个损失进行加权的操作。这8个损失有7个来自于prediction model的编码器输出，还有一个来自于通过RRM模块的最终输出结果。

对于每一个损失，都由BCE损失、SSIM损失和IoU损失三个部分组成，这旨在获得高质量的区域细分和明确的边界。

在这里插入图片描述

BCE损失表示如下：

在这里插入图片描述

SSIM损失最初提出用于图像质量评估，用于捕获图像中的结构信息。SSIM损失表示如下：

在这里插入图片描述

x是预测的像素集合，y是ground truth的像素集合。µ和σ分别表示均值和方差。C1和C2是为了避免除0。

IoU最初用来测量两个组的相似性，后来被用于目标检测和分割的标准评估度量。我们将其用于显著性目标检测，其表达式如下：

在这里插入图片描述

在这里插入图片描述

如Fig5所示，说明了每个损失的影响。

BCE损失是像素级的，重点关注前景与背景，为所有像素保持平滑的梯度，这有助于对所有像素融合。

SSIM损失是patch级的，其考虑每个像素的本地领域，它为边界分配了更高的权重，有助于模型关注边界信息。随着训练的进行，BCE损失变得很小的时候，SSIM损失可以确保仍有足够的梯度来推动学习。

IoU损失是map级的。该损失重点关注前景。

三、实验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
BASNet: Boundary-Aware Salient Object Detection阅读笔记

CVPR 2019Xuebin Qin, Zichen Zhang, Chenyang Huang, Chao Gao, Masood Dehghan, Martin Jagersand论文地址一、简介提出了边界感知显著性目标检测网络（BASNet），它由Predict Module和RRM模块组成，Predict Module模块用于得到粗略的显著性图像，RRM用于克服“coarse”。提出了一种新的混合损失，融合BCE，SSIM和IoU损失，分别针对pixel-level, patch-lev
复制链接

扫一扫

专栏目录

Ma lidong CSDN认证博客专家 CSDN认证企业博客

码龄7年

99: 原创

23万+: 周排名

55万+: 总排名

27万+: 访问

: 等级

2739: 积分

169: 粉丝

343: 获赞

120: 评论

1553: 收藏

私信

关注

热门文章

分类专栏

最新评论

pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
犯罪中止: 呃呃呃呃呃谢谢啊我关了之后立马好了我靠
pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
yuli678: 应该是网络问题，我是把.whl文件下到本机上，再传到的服务器上，再进行安装的
pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
giant2337: 我也是问问怎么解决的呀
pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
giant2337: 您好，想问下怎么关翻墙代理啊
模式识别报告：HWDB1.1手写汉字识别
心平气和_: 您好！我按照您的步骤一步一步进行了，但是请问出现Traceback (most recent call last): File "train.py", line 117, in <module> train(epoch, net, criterion, optimizer, trainloader, writer=writer, scheduler=scheduler) File "train.py", line 60, in train loss = criterion(outputs, labels) File "/root/miniconda3/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/root/miniconda3/lib/python3.8/site-packages/torch/nn/modules/loss.py", line 1150, in forward return F.cross_entropy(input, target, weight=self.weight, File "/root/miniconda3/lib/python3.8/site-packages/torch/nn/functional.py", line 2846, in cross_entropy return torch._C._nn.cross_entropy_loss(input, target, weight, _Reduction.get_enum(reduction), ignore_index, label_smoothing) RuntimeError: CUDA error: device-side assert triggered 这种报错是什么原因啊？该怎么修改呢？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ma lidong 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。