Sigmoid函数

最新推荐文章于 2024-06-21 09:04:41 发布

qq280929090

最新推荐文章于 2024-06-21 09:04:41 发布

阅读量4.7k

点赞数 1

分类专栏： Deep Learning 文章标签： Sigmoid函数激活函数

Deep Learning 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Sigmoid函数是一个有着优美S形曲线的数学函数，在逻辑回归、人工神经网络中有着广泛的应用。Sigmoid函数的数学形式是：

f (x) = 1 1 + e - x

其函数图像如下：

这里写图片描述

可以看出，sigmoid函数连续，光滑，严格单调，以(0,0.5)中心对称，是一个非常良好的阈值函数。

当x趋近负无穷时，y趋近于0；趋近于正无穷时，y趋近于1；x=0时，y=0.5。当然，在x超出[-6,6]的范围后，函数值基本上没有变化，值非常接近，在应用中一般不考虑。

Sigmoid函数的值域范围限制在(0,1)之间，我们知道[0,1]与概率值的范围是相对应的，这样sigmoid函数就能与一个概率分布联系起来了。

Sigmoid函数的导数是其本身的函数，即，计算非常方便，也非常节省计算时间。推导过程如下：
根据常用的求导公式，得到：

f' (x) = (- 1) (1 + e - x) - 2 (0 + (- 1) e - x) = e - x ( 1 + e - x ) 2 = e - x 1 + e - x 1 1 + e - x

而：

1 - f (x) = 1 - 1 1 + e - x = e - x 1 + e - x

因此， f′(x)=f(x)(1−f(x))f′(x)=f(x)(1−f(x))。

虽然sigmoid函数拥有良好的性质，可以用在分类问题上，如作为逻辑回归模型的分类器。但为什么偏偏选用这个函数呢？除了上述的数学上更易处理外，还有其本身的推导特性。

对于分类问题，尤其是二分类问题，都假定是服从伯努利分布。伯努利分布的概率质量函数PMF为：

f (x | p) = p x (1 - p) 1 - x

根据《指数分布族》的一般表达式框架：

f (x | θ) = h (x) exp {η (θ) T (x) - A (θ)}

将伯努利分布变形为：

f (x | p) = exp {ln (p 1 - p) x + log (1 - p)}

其中： θ=pθ=p， h(x)=1h(x)=1， T(x)=xT(x)=x， η(θ)=lnp1−pη(θ)=ln⁡p1−p， A(θ)=−ln(1−p)A(θ)=−ln⁡(1−p)。因此，伯努利分布也属于指数分布族。

我们可以推导下和之间的关系：

η (θ) = ln p 1 - p

则：

- η (θ) = - ln p 1 - p = ln 1 - p p = ln (1 p - 1)

得到:

e - η (θ) = 1 p - 1

1 + e - η (θ) = 1 p

p = 1 1 + e - η ( θ )

这也就是sigmoid函数形式。

版权声明：无需授权，可任意转载。 https://blog.csdn.net/saltriver/article/details/57531963

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Sigmoid函数

Sigmoid函数是一个有着优美S形曲线的数学函数，在逻辑回归、人工神经网络中有着广泛的应用。Sigmoid函数的数学形式是： f(x)=11+e−x其函数图像如下：可以看出，sigmoid函数连续，光滑，严格单调，以(0,0.5)中心对称，是一个非常良好的阈值函数。当x趋近负无穷时，y趋近于0；趋近于正无穷时，y趋近于1；x=0时，y=0.5。当然，在x超出[-6,6]的范围后，函数值基本上没...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。