深入理解Softmax：从“Hard”到“Soft”的转变

修炼室

已于 2024-08-19 16:48:41 修改

阅读量1.2k

点赞数 7

分类专栏： AI 文章标签： softmax 机器学习

于 2024-08-19 16:41:25 首次发布

本文链接：https://blog.csdn.net/qq_22841387/article/details/141328944

版权

深入理解Softmax：从“Hard”到“Soft”的转变

在机器学习的分类任务中，Softmax 函数是一个极其重要的工具。它不仅将神经网络的输出转化为概率分布，还能有效处理多分类问题。然而，为了更好地理解Softmax，我们可以先将其拆解为 “soft” 和 “max” 两个部分，并探讨它们各自的意义。

从“Hard”到“Soft”

在某些情况下，我们可能会考虑直接选择输出层中的最大值作为预测结果。这种方式可以被称为 “Hard” 选择，即直接在所有输出中选择最大的那个，忽略其他所有信息。举个例子，假设我们有一个输出向量 ([0.2, 0.3, 0.5])，在这种 Hard 选择方式中，我们会直接选择最大值 (0.5) 对应的类别作为最终的预测结果。

在代码实现上，这种 Hard 选择非常简单：

import numpy as np

# 示例数据
outputs = np.array([0.2, 0.3, 0.5])

# Hard max选择
predicted_class = np.argmax(outputs)
print(predicted_class)  # 输出：2，对应0.5