[深度学习] 权值初始化 xavier和he_normal

vcvycy

已于 2023-06-02 19:49:32 修改

阅读量2.3w

点赞数 7

文章标签：深度学习人工智能神经网络

于 2018-03-04 14:06:41 首次发布

本文链接：https://blog.csdn.net/vcvycy/article/details/79436379

版权

(1)论文

xavier论文：《Understanding the difficulty of training deep feedforward neural networks》

he_normal论文：《Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification》

(2)Tensorflow API，initializer：

tf.keras.initializers.he_normal()

tf.contrib.layers.xavier_initializer()

(0) 公式推导

核心：

前向传播时，对于某一层输入x，输出y，如何初始化w使得 x与y的分布一致？

y = sigma(xi * wi) + b , i= 1~n，表示n个神经元。

另外这个论文假设激活函数梯度为1，即没有激活函数

要使得 D(y) = D(x)，即w初始化后，输出的方差与输入方差一致：

D(y) = D(xi) = D(sigmal(xi*wi))

= n * D(xi * wi) // 此处根据公式 D(A+B) = D(A) + D(B)的到

= n * D(xi) * D(wi) // 根据公式:

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注