激活函数-softmax

最新推荐文章于 2024-09-13 09:56:35 发布

二月w

最新推荐文章于 2024-09-13 09:56:35 发布

阅读量423

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_45355712/article/details/131573751

版权

机器学习专栏收录该内容

6 篇文章 3 订阅

订阅专栏

softmax函数常用于神经网络的输出层，将多分类的输出转换为概率分布，其计算涉及指数运算可能导致溢出。通过引入常数C可以解决这个问题，即softmax_plus函数，它在处理最大值后再进行指数运算，防止了溢出，与原始softmax函数等效。

摘要由CSDN通过智能技术生成

softmax

Softmax函数定义如下，其中a_k是分类器前级输出单元的输出。i表示类别索引，总的类别个数为n。y_k表示的是当前元素的指数与所有元素指数和的比值(函数的输出结果)。通过Softmax函数就可以将多分类的输出数值转化为相对概率，而这些值的累和为1，常用于神经网络输出层。表达式：
${{\rm{y}}_{\rm{k}}} = \frac{{\exp ({a_k})}}{{\sum\limits_1^n {\exp ({a_i})} }}$
示例：
在这里插入图片描述
使用numpy实现softmax函数：

# softmax函数
def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

但是如上这种softmax函数非常容易出现溢出的问题，因为指数函数很容易发生指数爆炸现象。故做如下修改：
${y_k} = \frac{{\exp ({a_k})}}{{\sum\limits_1^n {\exp ({a_i})} }}\\ = \frac{{C\exp ({a_k})}}{{C\sum\limits_1^n {\exp ({a_i})} }}\\ = \frac{{\exp ({a_k} + \log C)}}{{\sum\limits_1^n {\exp ({a_i} + \log C)} }}\\ = \frac{{\exp ({a_k}+C^` )}}{{\sum\limits_1^n {\exp ({a_i} +C^`)} }}$
同样也使用numpy实现：

# 升级版softmax函数
def softmax_plus(a):
    c = np.max(a)
    exp_a = np.exp(a - c)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

其实这个就是解决了上限的softmax的移除问题的softmax函数，这两个函数是完全相等的。

二月w

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录