BN做的是归一化某一层隐层的激活单元,使得下一层参数的训练更加快。 做法:给定神经网络中间隐层的值,假设某一层所有的隐层单元为 1. 计算均值: 2. 计算方差: 3. 4. (所以) 5. 用代替代替 未完待续……