cs231n_Batch Normalization

最新推荐文章于 2022-02-10 11:10:14 发布

DCGJ666

最新推荐文章于 2022-02-10 11:10:14 发布

阅读量355

点赞数 1

分类专栏：深度学习文章标签：深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DCGJ666/article/details/115767118

版权

深度学习专栏收录该内容

39 篇文章 1 订阅

订阅专栏

Batch Normalization

原理与总结

Batch Normalization 能够使得数据进行归一处理，可以解决内部协变量偏移，可以缓解梯度饱和问题。

公式：

$\mu = \frac{1}{m}\sum_{i=1}^mx_i$ 求出数据的均值

$\sigma^2 = \frac{1}{m}\sum_{i=1}^m(x_i-\mu)^2$ 求出数据的方差

$\hat{x}_i=\frac{x_i-\mu}{\sqrt{\sigma^2+\epsilon}}$

$y_i=\gamma\hat{x}_i+\beta$

然后根据该公式，我推导了Batch Normalization的前向以及反向传播的值与梯度

在这里插入图片描述

作业实现

batchnorm_forward

这里主要是根据上面的公式进行代码编写 batchnorm的前向传播。这里要注意在train和test的不同。

train中
test中固定var和mean 进行计算

在这里插入图片描述

测试结果：

在这里插入图片描述

batchnorm_backward

这里是根据上图中推导的batchnorm的反向传播公式进行代码编写

在这里插入图片描述

测试结果：
在这里插入图片描述

batchnorm_backward_alt

根据图中的反向传播公式可以直接求出最后的反向传播公式
在这里插入图片描述

测试结果：

在这里插入图片描述

Fully Connected Nets with Batch Normalization

测试结果：

在这里插入图片描述

Batchnorm for deep networks

测试结果：
在这里插入图片描述

Batchnorm and initialization

研究网络使用batchnorm之后的效果。

测试结果：
在这里插入图片描

Question

Describe the results of this experiment, and try to give a reason why the experiment gave the results that it did.

Answer:

batchnorm能够加快模型的收敛，这是因为batchnorm将数据进行归一化，使得每一层提取的特征更加规则。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
cs231n_Batch Normalization

Batch Normalization原理与总结Batch Normalization 能够使得数据进行归一处理，可以解决内部协变量偏移，可以缓解梯度饱和问题。公式：μ=1m∑i=1mxi\mu = \frac{1}{m}\sum_{i=1}^mx_iμ=m1∑i=1mxi 求出数据的均值σ2=1m∑i=1m(xi−μ)2\sigma^2 = \frac{1}{m}\sum_{i=1}^m(x_i-\mu)^2σ2=m1∑i=1m(xi−μ)2 求出数据的方差x^i=xi−μσ2+ϵ
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。