该论文提出LV-Net,其包含两个关键模块:一个双流的金字塔模块(L形状),一个使用了nested connection的编码器-解码器模块。具体的,该L形状的模块使用双流金字塔结构,将一系列互补的信息层次化的抽取出来。这一步,可以保留显著对象的的多样尺度和局部细节。V形状的模块,逐渐的将编码器的细节特征与解码器的语义特征通过nested connections的方式连接起来,目的是抑制杂乱的背景且对于显著性目标进行高亮化处理。
本文中,自然场景图像(总是RGB格式的)指的是由手持照相机或悬挂在地面上的某一个物体上的相机捕捉到的图像,其中,由此类相机拍摄到的图像中对象都是竖直方向的。
常见的目标检测,显著性目标检测和异常检测三者之间的差别:
目标检测是一个以检测出所有物体的通用性任务,显著性目标检测只管至于发现显著性目标,异常检测用于发现异常对象。同时,目标检测和异常检测总是使用bounding boxes来描画对象,而显著性目标检测是产生像素级别的显著性概率图
与其他论文相同,使用的诗句来源于Google Earth,且分辨路范围为0.5m-2m。与自然场景图象相比,RSIs中的对象总是有很多不同的朝向,尺寸和类型。同时,光学RSI图像与高频谱图像不同,高频谱图像具有更多的频带信息。而光学RSI包含很多人眼友好的颜色表示。
由于光学RSI总是以一个高角度拍摄户外,所以,就可能存在多样尺度的对象,多样化的场景和目标类型,杂乱的背景和阴影噪声。右时,在真实户外场景中&#