sigmoid Vs softmax

最新推荐文章于 2024-12-11 16:30:00 发布

JL_Jessie

最新推荐文章于 2024-12-11 16:30:00 发布

阅读量278

点赞数

分类专栏： python NLP

本文链接：https://blog.csdn.net/m0_37531129/article/details/111030731

版权

45 篇文章

订阅专栏

14 篇文章

订阅专栏

在逻辑回归模型中，我们可以使用sigmoid进行二分类，也可以使用softmax进行多分类。
但是这两个有什么区别呢？

$F(x_i) = \frac {1}{1+exp(-x_i)}$
sigmoid 函数是把输入单独转成0到1之间的输出

properties of sigmoid function
sigmoid 函数返回一个真是的输出值
sigmoid函数的一阶导数是非负数或者非正。
（非负：如果数值大于等于0，则导数非负）（非正：数值小于等于0）
sigmoid 函数使用
在logistic regression 中用于二分类
在神经网络模型中可用于激活函数（目前用在二分类的输出层比较多，中间层一般使用 tanh或者relu，relu计算速度快，tanh中心对称，且梯度消失比sigmoid控制的好，因为tanh的梯度在0-1之间 ,sigmoid的梯度在0-1/4之间）
在统计学中，sigmoid函数图是一个常用的累积分布函数。
sigmoid函数在python中的应用

import numpy as np 
def sigmoid(inputs):
	sigmoid_scores = [1/float(1+np.exp(-x)) for x in inputs]
	return sigmoid_scores
sigmoid([2,3,4,5])

sigmoid graph 随着输入增大会越来越接近1.

$F(x_i) = \frac {exp_{x_i}}{\sum_{j=0}^k (exp_{x_i})}$
softmax 计算的是n个不同事件发生的概率分布。计算的是每个事件在所有事件里面发生的概率大小。所以要计算全部的事件概率和。

使用softmax函数的优势是输出在0-1的概率值内，且所有加和也等于1. 如果用于多分类，返回的是每个类别对应的概率，target class就是高概率的值。

softmax:

sigmoid: