常用初始化方法

常用初始化方法

权值初始化,不良的权值初始化会导致输出层的输出值过大或者过小,从而引发梯度的消失或爆炸,最终导致我们的模型无法训练和使用。为了防止这种情况的发送,我们需要保证网络输出层的输出在一个合理的范围,就是要保证每一网络层的输出值的方差是1 ,遵循方差一致性原则,保证网络输出层的输出值不大不小。
所以有了以下的分布的权值初始化
在这里插入图片描述
分为四大类
在这里插入图片描述

总之最终目的就是将输出值控制在一个合理范围(合理的标准就是方差控制在1附近),防止梯度消失或者爆炸,不让训练瘫痪。
由此介绍一个函数
在这里插入图片描述
着重了解方差的变化尺度
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值