【李宏毅】机器学习 笔记08(Tips for deep learning)

注:这不是overfiting的结果,因为这里是training data

 

对于最后卡在local minima的点,可以通过类比现实物理中的惯性,在做梯度下降时,加上一个代表类似惯性的量momentum,和梯度共同影响下一步的移动,来解决这种卡住的情况:

 

这个平均值和所有的权重*(1-p)%的结果是可以约等的

如:两个input的时候:

左边,average=(w1x1+w2x2+w2x2+w1x1+0)/4=(w1x1+w2x2)/2

右边,p=50%,所有的权重*(1-p)%算的结果=average

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值