读书笔记:Deep Learning [Ada-Computation&ML series]--chapter4.Numerical Computation

part1.overflow and underflow
1.underflow:接近0的数被约等于0,overflow:很大的数被约等于正无穷或者负无穷
2.在softmax很常见
softmax(x)i = exp(xi)/sum (exp(xj))
假设所有的xi都等于一个常数c,如果c为很大的负数,exp(c)会underflow,使得上述分母为0.
如果c为很大的整数,exp(c)会overflow。
3.解决办法就是对于softmax(z),使得z = x - maxi xi,这样最大的数会变成exp^0

part2.Poor Conditioning
对于f(x) = A-1X,A可以做特征值分解,那么condition number定义为:max i,j | lamda  / lamda  |
也就是最大与最小特征值之比,如果这个数太大,说明矩阵的逆对于输入中小的扰动很敏感。

part3.Jacobian,Hessian Matrices
1.Jacobian:输入输出都是向量的函数的所有偏导数
2.Hessian:对jacobian再求导,相当于是二阶导
3.可以利用hessian来判断是否是局部最小,但仅对于正定或者负定矩阵有效。
4.利用梯度下降很难找到合适的step size以防止overshooting,因次考虑利用二阶梯度信息的牛顿法
5.牛顿法:如果f是正定的,那么一步可以得到解,如果是半正定的,迭代多步。但是牛顿法只适用于附近的关键点是最小点的情况(鞍点不work)
6.凸优化比较好:hessian是半正定的,没有鞍点,局部最优就是全局最优。 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值