softmax function

最新推荐文章于 2024-09-11 12:11:23 发布

只鸥周

最新推荐文章于 2024-09-11 12:11:23 发布

阅读量66

点赞数

分类专栏： AI基础文章标签：分类人工智能

本文链接：https://blog.csdn.net/zzk0126/article/details/132646599

版权

AI基础专栏收录该内容

7 篇文章 0 订阅

订阅专栏

概念

softmax函数（归一化的指数函数）：”squashes”(maps) a K-dimensional vector z of arbitrary real values to a K-dimensional vector σ(z) of real values in the range (0, 1) that add up to 1 （from wiki）。

向量原来的每个值都转换为指数的概率值： $\sigma(z)_j=\frac{e^{zj}}{\sum_{k=1}^Ke^zk}$
转换后的值是个概率值，在[0,1]之间；
转换后的向量加和为1。
下面是用代码举例子说明是怎么计算的：

>>> import math
>>> z = [1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0]
>>> z_exp = [math.exp(i) for i in z]
>>> sum_z_exp = sum(z_exp)
>>> softmax = [i / sum_z_exp for i in z_exp]
>>> print([round(i, 3) for i in softmax])
[0.024, 0.064, 0.175, 0.475, 0.024, 0.064, 0.175]

应用

神经网络的多分类问题，作为最后一层（输出层），转换为类别概率，如下图所示，但是这个图里面e的下标k应该写错了位置，k应该是z的下标（一般最后基于概率值有一个独热编码，对应具体的类别）：

将某个值转换为激活概率，比如增强学习领域，此时的其公式为： $P_t(a)=\frac{e^{\frac{q_t(a)}T}}{\sum_{i=1}^ne^{\frac{q_t(i)}T}}$

softmax vs logistic

参考这里：logistic函数和softmax函数
logistic：二分类问题，基于多项式分布
softmax：多分类问题，基于伯努利分布
因此logistic是softmax函数的一个特例，就是当K=2时的情况。所以在逻辑回归那里，也有softmax regression（多元逻辑回归）用于多分类问题，我在这里也记录了一点。
6-logistic-regression.html)也记录了一点。
在多分类里面，也可以使用多个one-vs-all的逻辑回归，达到多元回归的目的，这种操作和直接的softmax回归有什么不同？softmax回归输出的类是唯一互斥的，但是多个逻辑回归的输出类别不一定是互斥的。

只鸥周

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
softmax function

softmax函数（归一化的指数函数）：”squashes”(maps) a K-dimensional vector z of arbitrary real values to a K-dimensional vector σ(z) of real values in the range (0, 1) that add up to 1 （from。转换后的值是个概率值，在[0,1]之间；转换后的向量加和为1。
复制链接

扫一扫

专栏目录