ChangeFormer(A Transformer-based Siamese Network for Change Detection)

最新推荐文章于 2024-06-30 17:00:31 发布

小王今天没学习

最新推荐文章于 2024-06-30 17:00:31 发布

阅读量3.2k

点赞数

分类专栏：论文阅读文章标签： transformer 深度学习计算机视觉

本文链接：https://blog.csdn.net/m0_46223011/article/details/123533771

版权

论文阅读专栏收录该内容

6 篇文章 0 订阅

订阅专栏

ChangeFormer

论文地址：A Transformer-based Siamese Network for Change Detection
ChangeFormer的三个主要模块：
1.一个层次化的transformer编码器（用于提取双时相图片的粗细特征）
2.四个特征差异模块（计算不同尺度下的特征差异性）
3.一个轻量的MLP解码器（混合多层的特征差异以及预测Mask）
在这里插入图片描述

Hierarchical Transformer Encoder

Transformer Block

$Attention(Q,K,V)=Softmax(\frac{QK^T}{\sqrt{}d_{head}})V$

上式是一般的self-attention模块，其计算复杂度为 $O(HW^2)$ 。

加入Sequence Reduction处理（ $R$ 为减少率）：

$\widehat{S}=Reshape(\frac{HW}{R},C*R)S$

$Linear(C*R,C)\widehat{S}$

其中 $S$ 代表需要进行reduce的sequence，例如 $Q, K, V$ 向量， $R e s h a p e$ 为reshape操作， $L i n e a r$ 代表线性层。
这一步操作能够将 $Q, K, V$ 的size转为 $(\frac{HW}{R},C)$ 。这将复杂度降到了 $O(\frac{(HW)^2}{R})$ 。

位置信息编码

$F_{out}=MLP(GELU(Conv2D_{3\times3}(MLP(F_{in}))))+F_{in}$

$F_{in}$ 是self-attention提取到的特征， $G E L U$ 是Gaussian Error Linear Unit activation。

Downsampling Block

第一个Downsampling Block: $C o n v 2 D (K = 7, S = 4, P = 3)$
后面的Downsampling Block: $C o n v 2 D (K = 3 . S = 2, P = 1)$

Difference Module

Difference Module用来计算不同时相图片在不同层特征的差异：

$F^{i}_{diff}=BN(RELU(Conv2D_{3\times3}(Cat(F^i_{pre},F^i_{post}))))$

Cat代表 tensor concatenation。

MLP Decoder

MLP Decoder用来将前面提取到的多层特征聚集在一起来进行预测change map。
MLP主要包含3步：
MLP & Upsampling
先通过一个MLP layer将不同层的特征图的通道维统一，然后将每个上采样到size: $H/4 \times H/4$ :

$\widehat{F}^i_{diff}=Linear(C_i,C_{ebd})(F^i_{diff})\forall$

$\widehat{F}^i_{diff}=Upsample((H/4,W/4),"bilinear")(\widehat{F}^i_{diff})$

其中 $C_{ebd}$ 代表embedding dimension

Concatenation & Fusion
这一步通过MLP layer将不同特征图concat和融合:

$F=Linear(4C_{ebed},C_{ebed})(Cat(\widehat{F}^1_{diff},\widehat{F}^2_{diff},\widehat{F}^3_{diff},\widehat{F}^4_{diff}))$

Upsampling & Classification

用一个卷积将特征图F上采样为 $H\times W$ :
$C o n v 2 D (K = 3, S = 4)$
最后，将得到的特征图通过另一个MLP layer来预测change mask CM( $H\times W\times N_{cls}$ )
$N_{cls}$ 代表类别数即change 和 no-change :