BN实验总结

最新推荐文章于 2022-01-27 10:21:00 发布

许多天的rua

最新推荐文章于 2022-01-27 10:21:00 发布

阅读量236

点赞数

分类专栏：量化

本文链接：https://blog.csdn.net/qq_18053809/article/details/103375144

版权

量化专栏收录该内容

36 篇文章 0 订阅

订阅专栏

利用每个channel下的max 和min计算均值方差

方差	方差系数	均值	resnet-20/cifar-10的错误率
$max-min)^2$	无	$(m a x - m i n) / 2$	0.28
$max-min)^2$	$\frac {1} {\sqrt{2*ln(n)}}$ n是该channel下参数个数	$(m a x - m i n) / 2$	0.24
$max-min)^2$	$\frac {1} {\sqrt{2*ln(n)}}$	origin_mean	0.18
$m a x - m i n$	无	$(m a x - m i n) / 2$	0.31
$m a x - m i n$	$abs(1+\lambda) ，\lambda是可学习参量$	$(m a x - m i n) / 2$	0.25
$m a x - m i n$	$abs(1+\lambda)$	origin_mean	0.19
origin_var	无	origin_mean	0.18

将resnet20中间的一个卷积层的输出记录下来，该卷积层的输出有32个channel。计算输出的方差real_var和均值real_mean，同时按照上面的估算公式，分别估计方差estimateVar,均值estimateMean。

利用weight的统计值来估计均值和方差

$z = x * w = X_1W_1+X_2W_2+....X_{C_{in}}W_{C_{in}}=C_{in}XW$
$C_{in} * \sqrt{\frac{1}{2\pi}}*\mu_w$
$E(z^2)=C_{in}^2*\frac{1}{2}*\sigma^2_{w}$
将resnet20中间的一个卷积层的输出记录下来，该卷积层的输出有32个channel。计算输出的方差real_var和均值real_mean，同时按照上面的估算公式，分别估计方差estimateVar,均值estimateMean。
下图是 $v a r D i f f = e s t i m a t e V a r / r e a l V a r$ 。
在这里插入图片描述
下图是 $m e a n D i f f = e s t i m a t e M e a n / r e a l M e a n$ 。

由上面两图可以看出，对方差的估计是非常靠近真实的方差取值的。而均值的估计则比较差。

均值方差在整个训练过程中的变化

仍然取该层的输出，画出mean和var在整个训练过程中的变化趋势
在这里插入图片描述
从上面可以看出，随着训练过程的推进，各个channel的均值向着0靠近。

从上面的图看出，随着训练过程的推进，各个channel的方差逐渐降低。

许多天的rua

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
BN实验总结

利用每个channel下的max 和min计算均值方差方差方差系数均值resnet-20/cifar-10的错误率(max−min)2(max-min)^2(max−min)2无(max−min)/2(max-min)/2(max−min)/20.28(max−min)2(max-min)^2(max−min)212∗ln(n)\frac {1} {\sqr...
复制链接

扫一扫