从sigmoid到softmax的过程以及求导

潇洒哥611

已于 2023-11-19 15:59:15 修改

阅读量65

点赞数

文章标签： python numpy 机器学习

于 2023-11-19 15:57:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_72985002/article/details/134348075

版权

hardmax

a = np.array([1, 2, 3, 4, 5]) # 创建ndarray数组
a_max = np.max(a)

hardmax最大的特点就是只选出其中一个最大的值，即非黑即白。但是往往在实际中这种方式是不合情理的，比如对于文本分类来说，一篇文章或多或少包含着各种主题信息，我们更期望得到文章对于每个可能的文本类别的概率值（置信度），可以简单理解成属于对应类别的可信度。所以此时用到了soft的概念。

Softmax的含义就在于不再唯一的确定某一个最大值，而是为每个输出分类的结果都赋予一个概率值，表示属于每个类别的可能性。

这里需要注意一下，当使用Softmax函数作为输出节点的激活函数的时候，一般使用交叉熵作为损失函数。由于Softmax函数的数值计算过程中，很容易因为输出节点的输出值比较大而发生数值溢出的现象，在计算交叉熵的时候也可能会出现数值溢出的问题。为了数值计算的稳定性，TensorFlow提供了一个统一的接口，将Softmax与交叉熵损失函数同时实现，同时也处理了数值不稳定的异常，使用TensorFlow深度学习框架的时候，一般推荐使用这个统一的接口，避免分开使用Softmax函数与交叉熵损失函数。

分类问题都是计算交叉熵的。

sigmoid相当于是一个是一个二分类的softmax

但它们的意义却不相同，举个例子：

sigmoid分别为是狗的概率和不是狗的概率的信息熵

softmax为是狗和是猫的概率的信息熵

虽然某种意义上，它们一样，但是意义却不相同。

Softmax函数求导

往往在真实中，如果只预测一个结果，那么在目标中只有一个结点的值为1，比如我认为在该状态下，我想要输出的是第四个动作（第四个结点）,那么训练数据的输出就是a4 = 1,a5=0,a6=0，哎呀，这太好了，除了一个为1，其它都是0，那么所谓的求和符合，就是一个幌子，我可以去掉啦！

注意：log一般就指的ln

注意：上面的损失函数只针对正确类别的对应的输出节点，将这个位置的Softmax值最大化，而交叉熵则是直接衡量真实分布和实际输出的分布之间的距离。 one-hot那么就完全等价了。

接下来用交叉熵来求，更具有普遍性：

softmax偏导数左边那一串就是损失函数对softmax得到的概率求导，Yc是标签。

结果就出来了。也就是softmax得到的概率—标签概率，非常简单

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从sigmoid到softmax的过程以及求导

hardmaxhardmax最大的特点就是只选出其中一个最大的值，即非黑即白。但是往往在实际中这种方式是不合情理的，比如对于文本分类来说，一篇文章或多或少包含着各种主题信息，我们更期望得到文章对于每个可能的文本类别的概率值（置信度），可以简单理解成属于对应类别的可信度。所以此时用到了soft的概念。Softmax的含义就在于不再唯一的确定某一个最大值，而是为每个输出分类的结果都赋予一个概率值，表示属于每个类别的可能性。
复制链接

扫一扫

潇洒哥611 CSDN认证博客专家 CSDN认证企业博客

码龄2年

66: 原创

113万+: 周排名

3万+: 总排名

1万+: 访问

: 等级

930: 积分

191: 粉丝

278: 获赞

10: 评论

270: 收藏

私信

关注

热门文章

最新评论

广播机制的简明理解
CSDN-Ada助手: 恭喜您写了第20篇博客！题为“广播机制的简明理解”。您的文章深入浅出地介绍了广播机制的原理，让读者能够轻松理解。我很欣赏您在博客创作上的坚持和努力，这种持续创作的精神真是令人钦佩。在下一步的创作中，我建议您可以进一步拓展广播机制的应用领域，或是深入探讨广播机制与其他相关概念的关系。这样能够为读者提供更多有价值的知识，并且展示您的博客在这一领域的专业性。希望您能继续保持谦虚的态度，不断进步，期待您未来更多精彩的创作！
坐标上升算法(Coordinate Ascent)和smo算法概括
CSDN-Ada助手: 非常感谢您的持续创作，第17篇博客的标题“坐标上升算法(Coordinate Ascent)和smo算法概括”引起了我的兴趣。您对这两种算法的概括让我对它们有了初步的了解。不过，我还希望能够看到更多关于这些算法的具体应用案例和实践经验。希望您在下一篇博客中能够分享一些实际问题中使用这些算法的案例，并结合自己的经验给出一些实用的建议。再次恭喜您，期待您未来更多有价值的创作！
os的用法
CSDN-Ada助手: 恭喜您撰写第18篇博客！标题“os的用法”非常吸引人，我很高兴看到您对操作系统有如此深入的了解。您的博客内容一定会对读者产生积极影响，并帮助他们更好地理解和使用操作系统。在下一步的创作中，或许您可以考虑拓展一下关于操作系统的实际应用场景或者分享一些个人经验和见解。通过这种方式，您可以为读者提供更多有关操作系统的实用知识，并丰富他们的使用体验。再次恭喜您的持续创作，期待您的下一篇博客！请继续保持谦虚的态度，您的努力和知识分享将为大家带来更多的收获。
Python类的静态方法和类方法和__的意义
CSDN-Ada助手: 恭喜您写了第19篇博客！标题《Python类的静态方法和类方法和__的意义》看起来十分有趣和有深度。您对Python类的不同方法的解释和__的意义的探讨，无疑为读者提供了宝贵的知识。感谢您的分享！在下一步的创作中，我建议您可以进一步探索Python类的高级特性，如装饰器或元类。这些主题在Python编程中具有重要意义，对于进一步提升读者的技能水平将非常有帮助。期待您的下一篇博客，谦虚地继续分享您的知识和见解！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。