softmax 代码实现

最新推荐文章于 2024-08-28 11:17:46 发布

杨海er

最新推荐文章于 2024-08-28 11:17:46 发布

阅读量6.5k

点赞数 3

分类专栏：机器学习

本文链接：https://blog.csdn.net/yh1226/article/details/86668529

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

softmax在深度学习分类任务中常被用于最后一层输出每个类别的概率，其公式如下：

Zj表示第j个类别的输出值，一共有K类。在神经网络分类任务中，假如我们有3个类别，那么在神经网络的经过softmax之前会得到一个含有三个输出值的向量z（这里假设batchsize=1）。z中的三个值经过上面的softmax函数后会被映射成三个在（0,1）之间的概率值。

下面我们用代码来实现softmax函数：

import numpy as np
def softmax(z):
    z = np.array(z)
    z = z - max(z)
    z = np.exp(z)   #求e^zi值
    softmax_z = z / np.sum(z)
    return softmax_z

在第四行代码减去max(z)的目的是防止数据输入过大，会出现nan值的情况。我们可以在公式的分子和分母同时乘以一个常数C ，并把它变换到求和之中,就能得到一个等价公式：

C的值可自由选择,不会影响计算结果,通过这个技巧可以提高计算中的数值稳定性，防止出现nan。为了避免指数过大，我们通常将logC设为 -max(z)，即减去网络输出各个类别分值向量z中的最大值。

参考资料：

机器学习中的损失函数（着重比较：hinge loss vs softmax loss）

杨海er

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录