原文下载地址:https://arxiv.org/pdf/1906.08462.pdf
本文提出LV-Net,其包含两个关键模块:一个双流的金字塔模块(L形状),一个使用了嵌套链接的编码器-解码器模块。
具体嵌套连接的解释,详见https://blog.csdn.net/zhaoyinfu8021/article/details/93379764
具体的,该L形状的模块使用双流金字塔结构,将一系列互补的信息层次化的抽取出来。这一步,可以保留显著对象的的多样尺度和局部细节。
V形状的模块,逐渐的将编码器的细节特征与解码器的语义特征通过nested connections的方式连接起来,目的是抑制杂乱的背景且对于显著性目标进行高亮化处理。
本文中,自然场景图像(总是RGB格式的)指的是由手持照相机或悬挂在地面上的某一个物体上的相机捕捉到的图像,其中,由此类相机拍摄到的图像中对象都是竖直方向的。
常见的目标检测,显著性目标检测和异常检测三者之间的差别:目标检测是一个以检测出所有物体的通用性任务,显著性目标检测只管至于发现显著性目标,异常检测用于发现异常对象。同时,目标检测和异常检测总是使用bounding boxes来描画对象,而显著性目标检测是产生像素级别的显著性概率图
与其他论文相同&