自监督论文阅读笔记Index Your Position: A Novel Self-Supervised Learning Method for Remote Sensing Images Sema

最新推荐文章于 2023-11-28 21:57:38 发布

YoooooL_

最新推荐文章于 2023-11-28 21:57:38 发布

阅读量478

点赞数

分类专栏：论文阅读笔记文章标签：人工智能 python 深度学习计算机视觉机器学习

本文链接：https://blog.csdn.net/YoooooL_/article/details/125715257

版权

本文提出了一种名为IndexNet的新型自监督学习方法，专门针对遥感图像（RSI）的语义分割任务。传统自监督学习方法通常基于图像级别的比较，而IndexNet则考虑了RSI的多目标特性，通过索引对比和实例对比学习像素级和图像级表示，以适应RSI中目标的空间位置变化。实验结果显示，IndexNet在RSI语义分割任务上优于ImageNet预训练模型和其他自监督学习方法。

摘要由CSDN通过智能技术生成

Index Your Position: A Novel Self-Supervised Learning Method for Remote Sensing Images Semantic Segmentation

在没有人工监督的情况下学习有效的视觉表示是遥感图像（RSI）语义分割任务的一个关键问题，其中像素级注释很难获得。自监督学习 (SSL) 通过创建人工监督学习问题来学习有用的表示，最近已成为一种从未标记数据中学习的有效方法。当前的 SSL 方法通常是通过图像级预测任务在 ImageNet 上进行训练的。我们认为这对于 RSI 语义分割中的应用不是最优的，因为它没有考虑目标之间的空间位置信息，这对于 以多对象为特征的 RSI 的分割至关重要。

在这项研究中，我们提出了一种新的 自监督密集表示学习方法 IndexNet，用于 RSI 的语义分割。一方面，考虑到 RSI 的多目标特性，IndexNet 通过跟踪对象位置来学习 像素级表示，同时保持对对象位置变化的敏感性，以确保不造成不匹配。另一方面，通过结合图像级对比和像素级对比，IndexNet可以 学习时空不变特征。

实验结果表明，我们的方法比 ImageNet 预训练效果更好，并且优于最先进的 (SOTA) SSL 方法。

Introduction：

遥感图像 (RSI) 的语义分割旨在 为图像中的每个像素分配一个地理标签，是广泛的实际应用中的关键任务，例如土地覆盖映射 [1]、[2 ]、基础设施管理 [3]、[4] 和精准农业 [5]、[6]。由不同传感器、角度和天气引起的多个物体的复杂光谱响应使得 RSI 的语义分割特别具有挑战性。得益于近年来深度学习研究的蓬勃发展，RSI 的语义分割性能取得了很大的进步 [7]-[9]。

然而，语义分割需要 像素级的类标签 的收集，这很繁琐，需要丰富的经验和扎实的地理知识。尽管有许多公开可用的注释数据集 [10]-[12]，但 RSI 在时间和位置上差异很大，现有的标记数据只是图像的截取，而且，收集大量具有异常高丰富度的注释样本，包括全球区域、多分辨率、多季节和多光谱是困难的。解决此问题的一种方法是使用 迁移学习 [13] 来迁移从更大领域学习的知识，以提高目标领域的性能 或 减少对标记样本的依赖。最广泛使用的 RSI 语义分割迁移学习方法是基于 ImageNet [14]。然而，这种迁移学习策略 并没有显著提高性能，也没有利用大量未标记的数据。

自监督学习 (SSL) 的引入解决了这个问题，并利用了大量未标记的数据。 SSL 方法可以首先通过解决预先设计的任务（称为前置任务）从未标记的源数据中学习有用的表示，然后将它们迁移到目标任务（例如语义分割）。这种使用未标记图像进行表示学习的可能性引起了相当大的关注，导致 SSL [15]-[19] 取得了实质性进展。在当前方法中指导表示学习的自监督是 基于图像级别的比较。该学习流程的潜在先验是 同一图像的不同视图（裁剪）对应于同一对象，如图1（a）所示。

然而，由于高空成像，RSI 通常代表较宽的空间范围，这导致在一张图像中包含不同目标的可能性。结果，不同的随机裁剪可能对应不同的对象，如图1（b）和（c）所示。此外，当前的 SSL 方法主要是为只需要 图像级表示 的图像分类任务而设计的。然而，语义分割 需要图像级和像素级的表示 才能产生有希望的结果。尽管越来越多的研究 [20]-[23] 研究了用于密集预测任务的 SSL 预训练，但这些方法并未考虑 RSI 的独特特征。例如，DenseCL [20] 和 Self-EMD [23] 通过基于特征相似性 匹配像素来学习像素级表示，但由于 RSI 中目标的复杂多变的光谱响应 和 在预训练期间图像的人工增强 [见图 1(d)]，这些方法容易导致对应像素不匹配。 DetCon [21] 需要对图像进行额外的 SSL 预训练分割，这既耗时又不适合 RSI 的实际应用。

本文提出了一种新的 SSL 方法 IndexNet，用于 RSI 的语义分割。首先，引入 索引对比 来解释 RSI 中目标的广泛的光谱响应，这允许我们的模型 学习像素级表示并保留空间位置信息 以使学习的表示对于不同的目标不同。其次，考虑到 RSI 的巨大时间差异和语义分割任务对全局信息的需求，我们将实例对比方法 BYOL [18] 与索引对比相结合，以学习像素级和图像级时空不变表示。

最低0.47元/天解锁文章

YoooooL_

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
自监督论文阅读笔记Index Your Position: A Novel Self-Supervised Learning Method for Remote Sensing Images Sema

Index Your Position: A Novel Self-Supervised Learning Method for Remote Sensing Images Semantic Segmentation 在没有人工监督的情况下学习有效的视觉表示是遥感图像（RSI）语义分割任务的一个关键问题，其中像素级注释很难获得。自监督学习 (SSL) 通过创建人工监督学习问题来学习有用的表示，最近已成为一种从未标记数据中学习的有效方法。当前的 SSL 方法通常是通过图像级预测任务在
复制链接

扫一扫