《机器学习技法》第12课笔记 神经网络

课程来源:林轩田《机器学习技法》
课程地址: https://www.bilibili.com/video/av12469267/?p=1


1. 什么时候tanh(xw)最大?当x和w平行时最大。
所以实际上可以把每个神经元看成是对输入变量的模式进行学习。

2. 链式求导
s是神经元。


3. 训练神经元时,当w很大,这时候tanH(扁S型)就会落在很平的区域,这时候下降就很慢。所以建议初始w的参数选择随机并且比较小的值。

4. 如果要惩罚神经元数量:
1)加入l2,那么实际上是权重的放缩,神经元还在
2)加入l1,|w|在某些点不可导,会对反向求导造成影响
3)考虑l2*一个scale,让每次放缩都有一定的值,从而使小的w有机会降到0


5. 也可以使用早停
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值