批量规范化（batch normalization）

最新推荐文章于 2024-07-21 13:24:31 发布

我是小水水啊

最新推荐文章于 2024-07-21 13:24:31 发布

阅读量299

点赞数 8

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/don_t_always_ail/article/details/137259896

版权

深度学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

文章目录

简介
全连接层
卷积层
代码

简介

一种流行且有效的技术，可持续加速深层网络的收敛速度。
批量规范化应用于单个可选层（也可以应用到所有层），其原理如下：在每次训练迭代中，我们首先规范化输入，即通过减去其均值并除以其标准差，其中两者均基于当前小批量处理。接下来，我们应用比例系数和比例偏移。正是由于这个基于批量统计的标准化，才有了批量规范化的名称。
在模型训练过程中，批量规范化利用小批量的均值和标准差，不断调整神经网络的中间输出，使整个神经网络各层的中间输出值更加稳定。
在这里插入图片描述

拉伸参数（scale）:

和偏移参数（shift）: 在这里插入图片描述
应用标准化后，生成的小批量的平均值为0和单位方差为1

全连接层

在这里插入图片描述

卷积层

在这里插入图片描述

代码

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5), nn.BatchNorm2d(6), nn.Sigmoid(),
     # 批量规范化层，与卷积层的输出通道数相匹配
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.BatchNorm2d(16), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2), nn.Flatten(),
    nn.Linear(256, 120), nn.BatchNorm1d(120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.BatchNorm1d(84), nn.Sigmoid(),
    nn.Linear(84, 10))