深度学总结:weight_initialization

48 篇文章 0 订阅
26 篇文章 1 订阅

weight_initialization

Occam’s razor:简单一刀切设置0或者1

General rule for setting weights

The general rule for setting the weights in a neural network is to set them to be close to zero without being too small.

Good practice is to start your weights in the range of [ − y , y ] [-y, y] [y,y] where y = 1 / n y=1/\sqrt{n} y=1/n
( n n n is the number of inputs to a given neuron).

Uniform Distribution:

设置分布区间为: [ − y , y ] [-y, y] [y,y] where y = 1 / n y=1/\sqrt{n} y=1/n

Normal Distribution:

设置分布区间为:a mean of 0 and a standard deviation of y = 1 / n y=1/\sqrt{n} y=1/n .

不设置初始化

利用网络特殊的结构,淡化初始化的影响:

比如BN,每一层接近a mean of 0 and a standard deviation of ,自动化处理,避免了初始化的影响。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值