深度学习（GAN）中concatenate 和 add的区别

最新推荐文章于 2024-12-18 10:40:27 发布

月下花弄影

最新推荐文章于 2024-12-18 10:40:27 发布

阅读量8.4k

点赞数 10

分类专栏：十年磨一剑数学理论 GAN

本文链接：https://blog.csdn.net/qq_27261889/article/details/91128461

版权

十年磨一剑同时被 3 个专栏收录

61 篇文章

订阅专栏

数学理论

15 篇文章

订阅专栏

GAN

8 篇文章

订阅专栏

本文详细探讨了深度学习中特征图的两种结合方式：add和concatenate，分析了它们的操作原理、应用场景及对后续处理的影响，指出add是concatenate的特殊情况，并通过GAN中的应用实例加深理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在深度学习中，有时候我们会涉及到两个特征结合，在使用卷积情况下就涉及feature map的结合。
一般情况下，feature maps的结合有两种方法，一种是元素对应相加，简称add，另一种就是把特征图堆到一起来，简称concatenate。
以下先详细说一下怎么操作。
假设feature map 1 的维度为 $B_1*C_1*H_1*W_1$ , 特征图feature map 2 的维度为 $B_2*C_2*H_2*W_2$
1）在add情况下，就是两个四维矩阵的按元素相加，那么这时候我们需要两个矩阵维度全部相等。并且相加后矩阵维度不变。
2）在concatenate情况下，我们把两个矩阵在某个维度叠加起来，这要求在这个连接的维度上可以不同，但是在其他维度上必须相等。叠加后，某个维度会增加，是两个矩阵上的某个维度相加。比如，我们在Channel这个维度上连接两个矩阵，那么新的矩阵维度是 $B_2*（C_2+C_1）*H_2*W_2$ 。

在程序实现上，我们可以这样：
在这里插入图片描述

但是，我们注意到，在做add或者concatenate之后，我们通常还会进一步做一些东西。比如ResNet中，我们利用add进行，这样可以维持梯度的大小，可以提高网络的深度。
我们需要考虑add和concatenate有什么不同。

结论：通常来讲，add是concatenate的特殊情况，add需要的内存和参数稍小于concatenate。

假设add或者concatenate之后还需要进行卷积操作，或者其他矩阵操作（如线性连接），我们用W表示这个过程。
$W[X,Y]=W_1X+W_1Y$ 这里我们使用中括号表示concatenate， $W_1,W_2$ 表示把两个参数分开， $W (X + Y) = W X + W Y$ ，假设add和concatenate得到的结果相等，那么 $W_1,W_2$ 就要相等了。说明add是concatenate的特殊情况。