在BN中训练的效果会受到batch影响,大的batch效果自然好,但是小的batch求出来的均值,方差不足以表达整体样本的分布特性,所以在测试阶段误差就会很大
GN的做法则是在通道上进行划分,在划分后的通道上进行normalization
https://blog.csdn.net/u013289254/article/details/99690730
group normalization
最新推荐文章于 2022-03-09 15:52:38 发布
在BN中训练的效果会受到batch影响,大的batch效果自然好,但是小的batch求出来的均值,方差不足以表达整体样本的分布特性,所以在测试阶段误差就会很大
GN的做法则是在通道上进行划分,在划分后的通道上进行normalization
https://blog.csdn.net/u013289254/article/details/99690730