Softmax函数

杨航 AI

已于 2024-08-06 21:09:18 修改

阅读量413

点赞数 4

文章标签：人工智能 AI

于 2024-08-06 21:06:26 首次发布

本文链接：https://blog.csdn.net/hanghangaidoudou/article/details/140966325

版权

Softmax函数是神经网络中常用的一个函数，特别是在多分类问题中用于将输出转换为概率分布。以下是Softmax函数的公式、代码以及其意义。
### 公式
假设我们有一个向量 \( z \) 包含了神经网络对于每个类别的原始分数（也称为 logits），Softmax 函数会为每个元素 \( z_i \) 计算以下概率：

其中，\( e^{z_i} \) 是 \( z_i \) 的指数，分母是所有指数的和，确保了所有概率之和为1。
### 意义
Softmax函数的意义在于它能够将任何实数向量转换为概率分布。在多分类问题中，每个类别都会得到一个在0到1之间的概率值，这些概率值的总和为1。这意味着可以将其解释为模型预测每个类别的概率。
### 代码（Python）
以下是一个使用Python和NumPy实现Softmax函数的例子：


import numpy as np
def softmax(z):
    # 计算每项的指数
    exp_z = np.exp(z)
    # 计算所有指数的总和
    sum_exp_z = np.sum(exp_z)
    # 计算softmax值
    softmax_z = exp_z / sum_exp_z
    return softmax_z
# 示例向量
z = np.array([1.0, 2.0, 3.0])
# 计算softmax
softmax_z = softmax(z)
print(softmax_z)

在这个例子中，`softmax` 函数首先计算输入向量 `z` 中每个元素的指数，然后计算所有指数的和，最后用每个元素的指数除以这个和，得到每个类别的概率。
### 注意
在使用Softmax函数时，需要小心数值稳定性问题。当输入值非常大时，计算 \( e^{z_i} \) 可能会导致数值溢出。为了解决这个问题，通常在计算指数之前从输入向量中减去最大值，这样可以保证计算更加稳定：


def stable_softmax(z):
    # 减去最大值以避免数值溢出
    shift_z = z - np.max(z)
    exp_z = np.exp(shift_z)
    sum_exp_z = np.sum(exp_z)
    return exp_z / sum_exp_z

使用 `stable_softmax` 函数代替之前的 `softmax` 函数可以避免在处理非常大数值时可能出现的数值不稳定问题。

在数学中，"e" 是自然对数的底数，它是一个无理数，其值大约为：
\[ e \approx 2.718281828459045 \]
"e" 是非常重要的数学常数，经常出现在自然增长或衰减的过程中，比如在计算复利时。在计算Softmax函数时，"e" 用于计算输入值的指数，即 \( e^{z_i} \)。在编程或Excel中，通常使用内置的数学库或函数来获取 "e" 的值。例如，在Python中，可以使用 `math.e` 来获取 "e" 的值，在Excel中，可以使用 `EXP(1)` 函数来得到 "e"。

杨航 AI

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
Softmax函数

在多分类问题中，每个类别都会得到一个在0到1之间的概率值，这些概率值的总和为1。在这个例子中，`softmax` 函数首先计算输入向量 `z` 中每个元素的指数，然后计算所有指数的和，最后用每个元素的指数除以这个和，得到每个类别的概率。使用 `stable_softmax` 函数代替之前的 `softmax` 函数可以避免在处理非常大数值时可能出现的数值不稳定问题。其中，\( e^{z_i} \) 是 \( z_i \) 的指数，分母是所有指数的和，确保了所有概率之和为1。# 计算所有指数的总和。
复制链接

扫一扫