Sigmoid和Softmax共通与区分

最新推荐文章于 2024-05-08 19:54:02 发布

Netceor

最新推荐文章于 2024-05-08 19:54:02 发布

阅读量860

点赞数

分类专栏：计算机科学与技术文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/netceor/article/details/129147790

版权

计算机科学与技术专栏收录该内容

9 篇文章 3 订阅

订阅专栏

Softmax和Sigmoid是神经网络中常用的激活函数，两者都能将输入非线性化。Softmax适用于多分类问题，输出归一化的概率分布，而Sigmoid常用于二分类，输出介于0和1之间的概率。Softmax防止数值溢出的技巧是使用e^-x，而Sigmoid在极端值处的导数为0可能导致梯度消失问题。

摘要由CSDN通过智能技术生成

一、共同点

Softmax以及Sigmoid这两者都是神经网络中的激活函数，将输入非线性化。

都作为神经网络的最后一层，将输出数值转换为概率值。

二、不同点

1、Softmax

$\frac{e^{x_{i}}}{\sum_{j=1}^{n}e^{x_{j}}}$

场景：

对于N分类问题，Softmax输入N个类别的概率（ $\sum_{i=1}^{N}p_{i}=1$ ），对应 $p_{i}$ 概率最大的 $i$ 即为判定的类别。

特性：

Softmax得出的是归一化类别概率，真实类别有放大。
零点不可微
负输入梯度为0
非负数且概率和为1，得到不同概率间的相互关联

Tricks：

Softmax作为激活函数时会将 $e^{x}$ 替换为 $e^{-x}$ 防止数值过大而溢出

2、Sigmoid

$\frac{1}{1+e^{-x}}$

场景：

对于N分类问题，可以确定多个类别（>0.5为1，<0.5为0）
单调递增且其反函数也有递增的性质，此函数也经常被用作神经网络的阈值函数中。 $Sigmoid'(x)=Sigmoid(x)\cdot(1-Sigmoid(x))$

特性：

对应其值加起来并不为1
梯度平滑，避免梯度跳跃；连续函数，可导可微

缺陷：

横向坐标轴正负无穷的时候，两侧导数为0，造成梯度消失
输出非0时，均值收敛速度慢（容易对梯度造成影响）
e的幂次运算比较复杂，训练时间比较长

参考链接：

三分钟认知Softmax和Sigmoid的详细区别

Softmax和Sigmoid函数的区别

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Sigmoid和Softmax共通与区分

Softmax以及Sigmoid这两者都是神经网络中的激活函数，将输入非线性化。都作为神经网络的最后一层，将输出数值转换为概率值。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。