[深度学习] 权值初始化 xavier和he_normal

一、概述与应用

(1)论文

    xavier论文:《Understanding the difficulty of training deep feedforward neural networks》

    he_normal论文:《Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification》

(2)Tensorflow API,initializer:

     tf.keras.initializers.he_normal()

     tf.contrib.layers.xavier_initializer()

二、xavier原理

(0) 公式推导

核心:

前向传播时,对于某一层输入x,输出y,如何初始化w使得 x与y的分布一致?

y = sigma(xi * wi) + b , i= 1~n,表示n个神经元。

另外这个论文假设激活函数梯度为1,即没有激活函数

要使得 D(y) = D(x),即w初始化后,输出的方差与输入方差一致:

D(y) = D(xi) = D(sigmal(xi*wi))

                   = n * D(xi * wi)         // 此处根据公式 D(A+B) = D(A) + D(B)的到

                   = n * D(xi) * D(wi)    // 根据公式:

  • 7
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值