sigmoid/softmax指数运算溢出问题的解决方法

今天用tensorflow的代码的时候,看到了tensorflow中计算cross
entropy方法的,不由得赞叹起来开发人员的巧妙构思。顺便捋了一下sigmoid/softmax指数运算溢出问题的解决方法。

sigmoid和softmax函数在计算中,都会用到指数运算 e − x e^{-x} ex或者 e x e^{x} ex,这个时候,如果前一步计算得到的 x x x非常小或者非常大的时候,都有溢出的风险,同时在计算cross entropy的时候,也要考虑下溢出,因为如果softmax分子太小近似为0,前面取log也是一个近似于无穷小的数,也会造成精度的减少。

而同时sigmoid和softmax本身就是一个在0~1之间的值,所以可以看到这种溢出只是一种中间过程,对于结果来说并不会有溢出,来看下如何去解决这个问题

  1. 对于sigmoid的计算,则可以分成一个判断

    a. 如果 x > 0 x>0 x>0 y = 1 1 + e − x y=\frac{1}{1+e^{-x}} y=1+ex1
    b. 如果 x < 0 x<0 x<0 y = e x 1 + e x y=\frac{e^x}{1+e^x} y=1+exex

  2. 对于sigmoid的log计算(如cross entropy):
    a. label 记为z
    b. c r o s s   e n t r o p y = z × − log ⁡ ( s i g m o i d ( x ) ) + ( 1 − z ) × − log ⁡ ( 1 − s i g m o i d ( x ) ) = z × − log ⁡ ( 1 1 + e − x ) + ( 1 − z ) ∗ − log ⁡ ( e − x 1 + e − x ) = z × log ⁡ ( 1 + e − x ) + ( 1 − z ) × ( − log ⁡ ( e − x ) + log ⁡ ( 1 + e − x ) ) = z × log ⁡ ( 1 + e − x ) + ( 1 − z

  • 6
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值