深度学习中的权重初始化与BatchNorm问题

Q1:权重初始化问题

随机的权重初始化会导致输出层输出值偏向0或者1

在这里插入图片描述
输出层输出值分布【鱼书p178】
在这里插入图片描述
因此需要合理的权重初始化方式:主要有Xavier、He两种


Q2:BN问题

BN是一种改变输出值分布的标准化操作,减小输出层分布的偏向性,可以有效的缓解梯度消失问题。

输出值经过激活函数后,导数值接近于0,反向传播,引起梯度消失问题

f ( ⋅ ) = s i g m o i d f ( x ) = 1 1 + e − x f ′ ( x ) = 1 1 + e − x − 1 ( 1 + e − x ) 2 = f ( x ) ( 1 − f ( x ) ) \begin{aligned} f(·) &= sigmoid \\ f(x) &= \frac {1}{1 + e ^ {-x}} \\ f'(x) &= \frac {1}{1 + e ^ {-x}} - \frac {1}{(1 + e ^ {-x})^2} \\ &= f(x)(1 - f(x)) \end{aligned} f()f(x)f(x)=sigmoid=1+ex1=1+ex1(1+ex)21=f(x)(1f(x))

因此需要合理的权重初始化方式:主要有Xavier、He两种


参考
1.鱼书
2.latex数学符号
3.latex符号重音

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值