tf中的batchnorm

最新推荐文章于 2022-11-15 20:34:04 发布

哈工程第一亚索

最新推荐文章于 2022-11-15 20:34:04 发布

阅读量589

点赞数

分类专栏： tensorflow 文章标签： tensorflow 深度学习人工智能

本文链接：https://blog.csdn.net/qq_46588746/article/details/120418316

版权

37 篇文章 2 订阅

订阅专栏

在使用sigmoid函数时，在函数两端的梯度几乎为0，位于这部分区间的数据参数更新很慢。利用
normalization可以把之前数据的分布平移缩放到0附近，这样有利于数据参数更新
image Normalization（图片数据规整化）

def normalize(x, mean, std):
    x = x - mean
    x = x / std
    return x

通过计算出的均值和方差将数据规整化 $\check z^i = \frac{z^i -\mu}{\sigma}$
通过学习而得的参数（学习而得的均值和方差）将数据规整化，使其服从N( $\beta$ $\gamma$ )分布 $\hat z^i = \gamma \bigodot \check z^i+\beta$

使用函数net = layers.BatchNormalization()实现，其中默认的四个参数分别如下所示
axis=-1 表示在哪个轴上做normalization
center=True 表示是否使用 $\beta$ 参数
scale=True 表示是否使用 $\gamma$ 参数
trainable=True 表示 $\beta$ , $\gamma$ 参数是否需要反向传播

关注

专栏目录