sigmoid函数的数值稳定性

最新推荐文章于 2025-03-16 09:01:52 发布

xiamentingtao

最新推荐文章于 2025-03-16 09:01:52 发布

阅读量2.9k

点赞数 2

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiamentingtao/article/details/79130792

版权

深度学习专栏收录该内容

25 篇文章

订阅专栏

本文深入探讨了Sigmoid函数在深度学习中的应用及其数值稳定性问题，特别是针对1-f(x)时出现的不稳定现象，并提出了两种解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在深度学习中，我们常常选用sigmoid函数作为激活函数。sigmoid函数的具体形式如下：

f (x) = 1 1 + e - x

$f(x)=\frac{1}{1+e^{-x}}$
曲线表示为：

再画大一点，取x区间更大一些，则为：

这里写图片描述

这里写图片描述

显然从图像上看，sigmoid函数是数值稳定的，即对于更大范围的x，y的取值是连续的，有效的。

从理论上看，

lim x \to + \infty f (x) = 1; lim x \to - \infty f (x) = 0

${\lim}_{x\rightarrow +\infty}f(x)=1;\\ {\lim}_{x\rightarrow -\infty}f(x)=0$
且中间数值可以从数学上证明是稳定的。
但我们考虑1-f(x)呢？

1 - f (x) = e - x 1 + e - x

$1- f(x)=\frac{e^{-x}}{1+e^{-x}}$
我们用matlab绘制其曲线：

这里写图片描述

我们发现这时，当x趋向负无穷，甚至仅仅x趋向-800，此时1-f(x)就不再稳定了，在matlab的值变成了NAN了。

其实我们发现，对于 1- f(x)，显然当x趋向正无穷时，还是稳定的，此时：
分子： $e^{-x}\rightarrow 0$ ,而分母: $1+e^{-x} \rightarrow 1$ ,

显然 $\frac{0}{1}$ ，结果趋向0.

但是当x趋向负无穷时，此时，
分子： $e^{-x}\rightarrow +\infty$ ,而分母: $1+e^{-x} \rightarrow +\infty$ ,
此时：
$\frac{e^{-x}}{1+e^{-x}}$ 就会变得不稳定,尽管理论上趋向1。
因此就出现了以上的图像。

那么如何解决这种不稳定问题的解呢？

其实有两种办法：

（一）先计算稳定的f(x),结果赋予y,再计算1-y .

乍看从数学上，好像完全一致，但是在数值解上不等价。 y=f(x)是稳定的，因此对于1-f(x)=1-y也变成了稳定的解。

我们从图像上证明：

这里写图片描述

此时就正确了，与理论解完全一致。

（二）直接从1-f(x)着手
这里我们从caffe的sigmoid_cross_entropy_loss_layer.cpp得到启发。

主要办法就是对于

1 - f (x) = e - x 1 + e - x

$1- f(x)=\frac{e^{-x}}{1+e^{-x}}$
分别考虑正负x.

当 $x\geq 0$ 时，维持上式不变；
当 $x< 0$ 时，分子分母同时乘以 $e^x$ ,则有：

e - x 1 + e - x = ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ e - x 1 + e - x 1 1 + e x x \geq 0 x < 0

$\frac{e^{-x}}{1+e^{-x}}=\left\{\begin{matrix} \frac{e^{-x}}{1+e^{-x}} & x\geq 0\\ \frac{1}{1+e^{x}}& x< 0 \end{matrix}\right.$

此时绘制曲线为：

这里写图片描述

因此在实际coding中，我们需要考虑计算的稳定性。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。