深度学习入门（六）——softmax函数的改良

最新推荐文章于 2024-08-20 17:57:03 发布

程序员到程序猴

最新推荐文章于 2024-08-20 17:57:03 发布

阅读量1.4k

点赞数 2

文章标签：深度学习机器学习 python

本文链接：https://blog.csdn.net/m0_72708909/article/details/126832387

版权

本文介绍了深度学习中分类问题的softmax函数，讨论了其在处理指数运算时可能出现的大数值问题，并提出了一种改良实现方法，通过引入常数C避免溢出，通常选择输入信号的最大值作为C的值。

摘要由CSDN通过智能技术生成

输出层的设计

机器学习的问题大致可以分为分类问题和回归问题。分类问题是数据属于哪一个类别的问题。比如，区分图像中的人是男性还是女性的问题就是分类问题。而回归问题是根据某个输入预测一个（连续的）数值的问题。比如，根据一个人的图像预测这个人的体重的问题就是回归问题（类似“57.4kg”这样的预测）。神经网络可以用在分类问题和回归问题上，不过需要根据情况改变输出层的激活函数。一般而言，回归问题用恒等函数，分类问题用softmax函数。

恒等函数会将输入按原样输出，对于输入的信息，不加以任何改动地直接输出。因此，在输出层使用恒等函数时，输入信号会原封不动地被输出。

分类问题中使用的softmax函数可以用下面的式子：

exp(x)是表示ex的指数函数（e是纳皮尔常数2.7182 …）。假设输出层共有n个神经元，计算第k个神经元的输出yk。softmax函数的分子是输入信号ak的指数函数，分母是所有输入信号的指数函数的和。输出层的各个神经元都受到所有输入信号的影响。

实现softmax函数：

def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

softmax函数的实现中要进行指数函数的运算&#

最低0.47元/天解锁文章

程序员到程序猴

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫