2023-3 无监督/弱监督/区域监督变化检测：生成对抗网络全卷积变化检测框架

最新推荐文章于 2025-04-02 21:19:46 发布

yhyinXidian

最新推荐文章于 2025-04-02 21:19:46 发布

阅读量2.2k

点赞数

文章标签：生成对抗网络深度学习人工智能

本文链接：https://blog.csdn.net/qq782352459/article/details/129023400

版权

该文提出FCD-GAN框架，结合生成对抗网络进行无监督、弱监督和区域监督变化检测。利用Unet做分割器，生成器模拟光谱和空间变化，鉴别器处理语义变化。此框架能处理多种监督类型的变化检测任务，且在实验中表现出有效性，为遥感变化检测提供新途径。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者：Chen Wu

摘要：

大多数端到端网络都被提出用于监督变更检测，而非监督变更检测模型依赖于传统的预检测方法。因此，我们提出了一个带有生成对抗网络的全卷积变化检测框架，将无监督、弱监督、区域监督和全监督的变化检测任务统一到一个端到端框架中。利用基本的Unet分割器获取变化检测图，利用图像-图像生成器对多时段图像之间的光谱变化和空间变化进行建模，利用变化和不变判别器对弱监督和区域监督变化检测任务中的语义变化进行建模。分段器和生成器的迭代优化可以构建一个端到端的无监督变化检测网络，分段器和鉴别器之间的对抗过程可以为弱监督和区域监督变化检测提供解决方案，分段器本身可以训练为全监督任务。实验结果表明，该框架在无监督、弱监督和区域监督的变化检测中都是有效的。本文提出的框架为无监督、弱监督和区域监督的变化检测任务提供了新的理论定义，在探索端到端遥感变化检测网络方面具有巨大潜力。

1 简介

变化检测的目的：利用同一研究地点在不同时间的多时相遥感影像观测景观变化。

最开始，深度学习作为一个特征提取模块嵌入到传统变化检测过程中。将确保不变区块的特征差异最小作为学习的准则。

基于深度学习的无监督变化检测的另一种方法：通过预检测认定特定变化和未变化区域，并用相应的区域作为训练样本来建立深度网络模型进而获取更优的特征和区分语义标签。然而，这种方法深度依赖预检测的效果并且无法建立一个先进的端到到模型来充分利用深度学习。

随着有标注的变化检测数据集的公开，有监督的语义分割被引入到变化检测领域中来进行高分辨率图像上全卷积网络的二元变化或目标变化识别。虽然性能很好但是依赖高度耗费人力物力的数据标注。

利用固定的全卷积分割网络来处理多时相高分辨遥感图像时，变化检测任务可以被定义为：获取满足预定约束的一张合适的分割地图。全监督变化检测(FSCD)任务可以看作是对映射地图的完全约束，然而实际应用中难以提供充足的FSCD训练数据集。因为变化检测是一项复杂的任务，需要同时解释多时相图像对。

在无监督变化检测中（USCD），即使没有预先给定的样本和规则，仍然有先验知识：不变景观的表征可以从一张图像预测到另一张图像，而变化的景观则不能。

进一步，我们可以进一步定义弱监督变化检测（WSCD）任务，只给出一组多时相图像的变化或不变化标签，我们要在此基础上准确提取出变化区域。

最后，定义一种新的变化检测任务：仅需要绘制一个可能发生景观变化的区域(如矩形)，并准确地标记出确切的变化像素。约束条件是，模型标注了一个变化区域，这样分割图掩码的图像对就可以像预定义区域掩码的图像对一样被判定为不变。叫做区域监督变化检测（RSCD）

贡献：1）提出FCD-GAN包含上述变化检测 2）首个用全卷积端到端网络实现无监督变化检测 3）

提出一种用GAN的单阶段弱监督分割的新方法 4）提出了一种新的区域监督变化检测任务。

2 方法论

提出的框架总图：

由三个基础部分组成：segmentor（分割器）、generator（生成器）和discriminator（辨别器）

2.1 基础模块

分割器：（基础的U-net结构）用简单的级联融合进行多时相高分辨图像在编码中的融合。Sigmoid作为激活函数。编码器的两个分支是暹罗式。上采样方法是双线性插值。

U-net介绍：从零开始的U-net入门

生成器：可以认为，在地形不变的情况下，可以从一个图像预测到另一个图像。因此，我们从SRGAN[48]实现了一个类似的生成器。不同的是，最后一层没有使用sigmoid或tanh等激活函数，因为输入的多时相图像将通过标准归一化进行预处理。

辨别器：对SRGAN[48]中的判别网络进行了简化。在研究中，我们发现复杂网络在区分变化或不变的图像场景时会过于强大，以至于对抗进展中的平衡太容易被打破。编码器的分支是连体的。

GAN网络入门：GAN（生成对抗网络）的系统全面介绍（醍醐灌顶）

2.2 无监督变化检测

无监督变化检测的基本假设是:对于时空图像中的不变景观，它们在光谱、空间或语义方面具有一定的一致性;而对于变化的景观，它们可以是任何时间的变化

该模型想要找到一个变化区域，以便在剩余的区域中，一个图像可以准确地预测为另一个多时相图像。

然而，值得注意的是，有一种方法可以很容易地满足这个目标，那就是将所有像素标记为1。显然，这是一个错误的解决方案。为了避免这种无意义的解决方案，我们需要添加一个约束，即分割应该是0/1并且是稀疏的。最直接的方法是在损失函数中增加一个0-1的损失，而ℓ0范数很难优化。因此，我们释放这个约束到ℓ1范数。因此，将目标改写为: