摘要
现存问题:下图为两个目前比较好检测方法的预测误差随像素到其最近边缘的距离的分布。横坐标表示距离,已归一化为[0,1],纵坐标为预测误差。可以看出,像素越靠近边缘,越难预测。传统的显著性标签对显著性目标内部的像素都是同等对待的,这可能会导致预测误差较小的像素受到边缘的干扰;
提出方法:Label Decoupling Framework,该网络主要包含以下两部分:
- 标签解耦(LD):通过LD过程,特征图像被分离为两部分:主体和边缘细节。细节图由边缘和附近的像素组成,充分利用了近边缘的像素,使像素分布更加均衡。主题映射主要集中在远离边缘的像素上。
- 特征交互网络(FIN):FIN有两个分支,分别适用于主体图和细节图。将两个互补的分支融合在一起预测显著性映射,然后利用显著性映射对两个分支进行再次细化。这种迭代精化过程有助于获得逐渐精确的显著性图预测,促进分支之间的迭代信息交换。
网络详解
在这一部分要详细讲述网络的组成以及每部分的构造原理
整体网络架构:
Label Decoupling
正如上文提及的,作者根据边缘与中心区域各自的特点进行处理更为合理而不是平等的对待这些像素,如上图所示,是应用LD将图像分为两部分。为了实现这一目标,我们引入了距离变换(DT)来解耦原始标签,这是一种传统的图像处理算法。DT可以将二值图像转换为新图像,其中每个前景像素都有一个值,该值对应于通过距离函数得到的与背景的最小距离。
DT:DT的输入是二值图像,即可以被表示成两部分的的图像(如前景Ifg和背景Ibg),对于每个像素p, I[p]是