特征连接（Concat）和特征加法（Add）的区别

管不住嘴的要吃喝

已于 2023-10-25 21:08:45 修改

阅读量4.8k

点赞数 6

分类专栏：深度学习文章标签：深度学习神经网络 cnn 计算机视觉

于 2023-10-25 17:11:51 首次发布

本文链接：https://blog.csdn.net/weixin_45314480/article/details/134039333

版权

1 篇文章

订阅专栏

在深度学习中，特征连接（feature concatenation）和特征加法（feature addition）是两种不同的特征融合方式，它们在信息的整合和模型结构方面有不同的作用。

特征连接（Concatenation）：

特征连接是指将不同特征图按照某一维度（通常是通道维度）拼接在一起。例如，如果两个特征图的形状分别是（B, C1, H, W）和（B, C2, H, W），其中 B 表示批处理大小，C1 和 C2 分别表示通道数，H 和 W 表示高度和宽度，那么将它们特征连接后，得到的特征图形状将是（B, C1 + C2, H, W）。
特征连接通常用于多尺度特征融合，以充分利用来自不同分支或不同层次的信息。这样，模型可以同时考虑来自不同特征图的信息。
特征连接可能会导致特征图维度增加，需要更多的参数和计算资源。
示例：图像分割中的U-Net模型。U-Net将编码器和解码器之间的特征进行连接，以保留高分辨率的信息。编码器将图像特征逐渐减小，而解码器将它们连接起来，以获得最终的分割结果。这允许模型在不同尺度上保留信息，以提高分割性能。

特征加法是指将两个特征图按元素相加。这意味着相同位置的像素值会相互相加，得到一个新的特征图。
特征加法通常用于残差结构，如ResNet，其中一个分支的输出与另一个分支的输出相加。这允许模型学习残差信息，从而更容易训练深层网络。
特征加法有助于减小模型的计算负担，因为它不需要引入额外的参数。
示例：ResNet（Residual Network）。在ResNet中，残差块的一个分支是通过卷积操作获得的特征图，而另一个分支是输入特征图（恒等映射）。这两个分支的输出通过元素级相加，得到了残差信息。这允许模型学习残差，使其更容易训练深层网络。