《深度学习入门:基于python的理论实现》笔记

1. 第四章中:为何要设定损失函数?以数字识别任务为例,既然我们的目标是获得使识别精度尽可能高的神经网络,那不是应该把识别精度作为指标吗?

      在进行神经网络的学习时,不能将识别精度作为指标。因为如果以识别精度为指标,则参数的导数在绝大多数地方都会变为0。识别精度对微小的参数变化基本上没有什么反应,即便有反应,它的值也是不连续地、突然地变化。(后一句话就可以作为前一句话的理解吧)

2. 第五章中:为何用计算图解题?

     计算图的优点是,可以通过正向传播和反向传播高效地计算各个变量的导数值。

3. 第六章中:

    6.1 参数更新:SGD(随机梯度,之字型);Momentum(增加动量,一阶);AdaGrad(增加二阶);Adam(一阶+二阶)

    6.2 权重值的初始化:不要都设为0,必须随机生成初始值。总结一下,当激活函数使用ReLU时,权重初始值使用He初始值(),当激活函数为 sigmoid或 tanh等S型曲线函数时,初始值使用Xavier初始值。这是目前的最佳实践。(当前一层的节点数为n时

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值