BN层位于激活函数之前,它先对数据进行标准化,在进行缩放和平移。
标准化是防止数据达到饱和(即激活值分布在大部分都接近0或1),这样会使数据对激活函数不敏感。
而缩放平移是为神经网络学会,在标准化效果好时,尽量不抵消标准化的作用,而在标准化效果不好时,尽量去抵消一部分标准化的效果,相当于让神经网络学会要不要标准化,如何折中选择。
总之,BN层就是为了让让每一层的值在一个有效范围内传递下去。(这跟用xavier初始化网络参数的目的非常相似)
BN层的作用
最新推荐文章于 2024-02-13 22:33:15 发布