分类任务中softmax+argmax和直接argmax得到的结果有什么异同？

最新推荐文章于 2025-03-22 13:47:50 发布

ywfwyht

最新推荐文章于 2025-03-22 13:47:50 发布

阅读量1.2k

点赞数

分类专栏： python 人工智能深度学习文章标签：算法人工智能 python

本文链接：https://blog.csdn.net/qq_39506862/article/details/132598060

版权

python 同时被 3 个专栏收录

43 篇文章

订阅专栏

深度学习

31 篇文章

订阅专栏

人工智能

16 篇文章

订阅专栏

异同点：

直接使用argmax只能得到最大值的位置，而使用softmax+argmax把矩阵的值转化在0和1之间概率分布，且所有值的和为1，然后选取概率最大的元素作为输出，得到最大值的位置和该位置上的概率分布，会增加一定的计算量。
通过softmax+argmax可以将原始矩阵中的所有元素转化为概率值，使得各元素的权重得到了平衡，更具有可解释性；而直接使用argmax则只返回最大值的索引，忽略了其他元素的信息。此外，通过softmax+argmax可以灵活控制输出结果的数量，可以输出前n个最大值的索引，而直接使用argmax只能返回一个最大值的索引。
softmax+argmax可以用于多分类问题，每个元素可以表示为某个类别的概率，而直接使用argmax只适用于二分类或多分类问题中只有两个类别的情况。

相同点：

最后两者的结果是相同的，两种方法都可以找到矩阵中最大的值。

代码示例：

import numpy as np

# 构造一个5*5的随机矩阵
matrix = np.random.rand(5, 5)

# softmax+argmax
# p = np.exp(m)/np.sum(np.exp(m)) # 将矩阵中的每个元素转化为概率
# softmax_result = np.argmax(p) # 返回概率最大的索引
softmax_result = np.argmax(np.apply_along_axis(np.softmax, 1, matrix), axis=1)

# 直接使用argmax
argmax_result = np.argmax(matrix, axis=1)

print("Original matrix:\n", matrix)
print("\nsoftmax+argmax result:\n", softmax_result)
print("\nargmax result:\n", argmax_result)

输出：

Original matrix:
 [[0.50712117 0.41882609 0.12838709 0.14777572 0.05002968]
 [0.1468695  0.49966726 0.98388963 0.1329398  0.99236624]
 [0.18196213 0.47813681 0.98735743 0.7460055  0.83342566]
 [0.23392307 0.61984472 0.43340923 0.23700659 0.9244233 ]
 [0.23524479 0.80606302 0.83358194 0.37676559 0.27463544]]

softmax+argmax result:
 [0 4 2 4 2]

argmax result:
 [0 4 2 4 2]

从输出结果可以看出，softmax+argmax和argmax的结果是一样的，但是softmax+argmax得到的结果是归一化后的概率值。因为矩阵中的每个值都大于0，因此softmax不会改变矩阵中元素的相对大小。在实际应用中，softmax可能会对结果产生影响并产生不同的输出。