梯度与激活函数

梯度

初始化的影响

在这里插入图片描述
同样的网络,同样的参数,初始化不同,梯度下降的速度不同,得到最小值也不同,如上图。

学习率的影响

在这里插入图片描述学习率影响收敛的速度,初始情况下可以设置的大一些,不收敛在设置的小一些。

动量

在这里插入图片描述
梯度下降的时候,可能到达局部最优的情况,这时候给一个动量,用惯性冲出局部最优的情况。

常见公式求解梯度

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

激活函数

derivative

在这里插入图片描述
特点:在 z = 0 z = 0 z=0处不可导

Sigmoid Logistic

在这里插入图片描述特点:将 z z z ( − ∞ (- \infty ( , ∞ ) , \infty) ,)拉回到 ( 0 , 1 ) (0,1) (0,1),且可导
在这里插入图片描述
w w w求导结果也一样。

Tanh

在这里插入图片描述

在这里插入图片描述

RELU

在这里插入图片描述
神经网络中常用,原因在于 z < 0 , z<0, z<0,梯度为0, z > 0 , z>0, z>0梯度为1,这样传递的时候梯度变化不大,得到了比较好的保留。

Softmax

在这里插入图片描述
用于分类,且保证所有概率相加为1,而使用sigmod相加最大为3

另一个作用是金字塔作用,2/1=3,0.7/0.2=3.5;将差距拉的更大,将小的压缩到更小。
在这里插入图片描述
在这里插入图片描述
总结
在这里插入图片描述pytorch实现
p

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值