Batch Normalization与Shift-based Batch Normalization

qq_36134287

已于 2023-08-01 11:36:23 修改

阅读量78

点赞数

文章标签：深度学习机器学习

于 2023-08-01 11:31:43 首次发布

本文链接：https://blog.csdn.net/qq_36134287/article/details/132038693

版权

Shift-based Batch Normalization是一种变体的批量归一化（Batch Normalization，简称BN）方法。在传统的批量归一化中，每个特征维度都被标准化为具有零均值和单位方差的分布。而在Shift-based Batch Normalization中，额外引入了一个可学习的偏移参数，该参数被称为“shift”。

假设我们有一个卷积神经网络（CNN），其中包含一层使用Shift-based Batch Normalization的卷积层。这层具有多个特征图（feature maps），每个特征图由一系列数值组成。在Shift-based Batch Normalization中，每个特征图都有一个对应的偏移参数，用于调整其归一化后的值。

下面是一个使用Shift-based Batch Normalization的简化例子：

假设我们有一个3x3的卷积层，输出特征图包含2个通道（即有2个特征图）。该卷积层的输出如下：

```
Feature Map 1: [[3, 6, 9], [12, 15, 18], [21, 24, 27]]
Feature Map 2: [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
```

1. 计算每个通道的均值和方差：

对于Feature Map 1：
- 均值 `mean1 = (3 + 6 + 9 + 12 + 15 + 18 + 21 + 24 + 27) / 9 = 15`
- 方差 `variance1 = ((3-15)^2 + (6-15)^2 + ... + (27-15)^2) / 9 = 60`

对于Feature Map 2：
- 均值 `mean2 = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) / 9 = 5`
- 方差 `variance2 = ((1-5)^2 + (2-5)^2 + ... + (9-5)^2) / 9 = 6`

2. 对每个特征图进行归一化：

对于Feature Map 1：
- 归一化 `normalized_map1 = (feature_map1 - mean1) / sqrt(variance1 + epsilon)`
- 其中`epsilon`是一个很小的数（例如1e-5），用于避免除以零的情况。

对于Feature Map 2：
- 归一化 `normalized_map2 = (feature_map2 - mean2) / sqrt(variance2 + epsilon)`

3. 引入可学习的偏移参数（shift）：

假设我们有两个偏移参数`shift1`和`shift2`，它们分别对应Feature Map 1和Feature Map 2。在训练过程中，模型会学习这些偏移参数，使得归一化后的特征图更好地适应任务。

- 归一化后添加偏移 `shifted_map1 = normalized_map1 + shift1`
- 归一化后添加偏移 `shifted_map2 = normalized_map2 + shift2`

4. 经过Shift-based Batch Normalization后的特征图：

```
Shifted Feature Map 1: [[a1, b1, c1], [d1, e1, f1], [g1, h1, i1]]
Shifted Feature Map 2: [[a2, b2, c2], [d2, e2, f2], [g2, h2, i2]]
```

这样，Shift-based Batch Normalization引入了可学习的偏移参数，允许模型在归一化后对特征图进行调整，以更好地适应数据分布。这在某些场景中可能比传统的批量归一化方法更有效。注意，实际的模型中可能有更多通道和特征图，这里只是一个简化的例子。

qq_36134287

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Batch Normalization与Shift-based Batch Normalization

方差 `variance1 = ((3-15)^2 + (6-15)^2 + ... + (27-15)^2) / 9 = 60`- 均值 `mean1 = (3 + 6 + 9 + 12 + 15 + 18 + 21 + 24 + 27) / 9 = 15`- 方差 `variance2 = ((1-5)^2 + (2-5)^2 + ... + (9-5)^2) / 9 = 6`- 均值 `mean2 = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) / 9 = 5`
复制链接

扫一扫