AAAI
LeNo: Adversarial Robust Salient Object Detection Networks with Learnable Noise
Abstacrt
:目前很少有SOD
模型对人类视觉注意力难以察觉的对抗性攻击具有鲁棒性。先前的鲁棒显著性ROSA
对预分割的超像素进行重组,通过密集连接的条件随机场CRF
对粗糙的显著性图进行细化。与先前工作中依赖预处理和后处理的ROSA
不同,本文提出一种轻量级的可学习噪声LeNo
防御SOD
模型的对抗性攻击。LeNo
由浅噪声和噪声估计组成,分别嵌入到编码器与解码器中。本文将浅噪声初始化为十字形高斯分布,用噪声估计修改解码器。
对抗攻击
Code
Memory-aided Contrastive Consensus Learning for Co-salient Object Detection
Abstacrt
:协同显著性检测旨在检测一组相关源图像中的共同显著性目标。多数工作都是采用注意力机制寻找共同物体,本文提出一种记忆辅助对比共识学习框架MCCL
。本文提出群体共识聚合模块GCAM
来抽象每个图像组的共同特征,以学习群体共识;引入基于记忆的对比模块MCM
,保存并更新来自不同组的图像在一个记忆队列中的一致性,以使得一致性表示更具判别性;提出对抗完整性学习策略AIL
,以提高预测图的质量和完整性。
Code
~Parting Line~ |
---|
CVPR
Texture-guided Saliency Distilling for Unsupervised Salient Object Detection
Abstacrt
:基于深度学习的无监督显著性检测USOD主要依赖于传统手工方法或预训练网络生成的噪声显著性伪标签。为了解决噪声标签问题,现有的方法只关注具有可靠标签的简单样本easy sample,而忽略了困难样本hard sample中有价值的知识(信息)。本文提出新的USOD方法从易分样本、难分样本中挖掘丰富而准确的显著性知识(信息),包括基于样本置信度的显著性蒸馏策略CSD,对样本进行分类,引导模型从易分样本到难分样本的渐进式学习;以及边界感知纹理匹配策略BTM,通过匹配预测边界周围的纹理来细化噪声标签的边界。
code
Discriminative Co-Saliency and Background Mining Transformer for Co-Salient Object Detection
Abstacrt
:大多协同显著性检测集中于挖掘图像间的一致性关系,而忽略了对背景区域的显式探索。本文提出一种基于多粒度关联模块的判别性协同显著性和背景挖掘框架DMT
。具体说,首先提出一个区域到区域的相关模块,用于在保持计算效率的同时将图像间的关系引入逐像素分割特征;然后,使用两种类型的预定义token
,通过本文所提出的模块(对比度诱导像素到token
关联和协同显著性token
到token
关联模块),挖掘协同显著性和背景信息;设计token
引导的特征细化模块,增强token
引导下的分割特征的可判别性。
Modeling the Distributional Uncertainty for Salient Object Detection Models
Abstacrt
:现有的显著性检测大多侧重于提高模型的整体性能,而没有明确解释训练分布和测试分布之间的差异,本文提出一种特殊类型的认知不确定性,即分布不确定性,用于显著性检测。具体说,本文首次探索了类感知(class-aware
)分布差距探索技术,即长尾学习、单模型不确定性建模和测试时间策略,并将其应用于本文的类不可知(class-agnostic
)任务的分布不确定性建模。
Pixels, Regions, and Objects: Multiple Enhancement for Salient Object Detection
Abstacrt
:针对具有多个对象和背景杂乱的复杂场景,本文提出多重增强网路MENet
。通过模拟人类视觉系统HVS
,受到其边界敏感性、内容完整性、迭代细化和频率分解机制的启发,本文设计多级混合损失引导网络学习像素级、区域级和对象级特征;设计多尺度特征增强模块ME-Module
,通过改变输入特征序列的大小顺序,逐步聚合和细化全局或局部特征;采用迭代训练策略增强MENet
双分支解码器的边界特征和自适应特征。
~Parting Line~ |
---|
IEEE TPAMI
Co-Salient Object Detection with Co-Representation Purification
Abstacrt
:本文提出一种旨在搜索无噪声共同表征的协同表示净化方法CoRP
,搜索一些可能属于共同显著区域的像素级嵌入,从而构成共同表征,指导预测。
Code
代码待公布 |
---|
TNNLS
Multi-Projection Fusion and Refinement Network for Salient Object Detection in 360◦ Omnidirectional Image
Abstacrt
:本文提出一种多投影融合和细化网络MPFR
,以检测失真严重、场景复杂的全向图像中的显著性目标。将等矩投影图像和对应的四幅立体展开图像同时作为输入嵌入到网络中,设计动态加权融合模块DWF
,从特征间和特征内角度,以互补和动态的方式自适应融合不同投影的特征,同时设计过滤和细化模块FR
抑制特征本身和特征之间的冗余信息。
Code
持续更新ing |
---|