从tf.math.log_softmax和tf.keras.losses.SparseCategoricalCrossentropy看softmax的上溢和下溢问题

最新推荐文章于 2023-04-03 21:37:49 发布

会发paper的学渣

最新推荐文章于 2023-04-03 21:37:49 发布

阅读量392

点赞数 1

分类专栏：深度学习基础 tensorflow2.x 文章标签：深度学习 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sslfk/article/details/128708097

版权

tensorflow2.x 同时被 2 个专栏收录

39 篇文章 0 订阅

订阅专栏

深度学习基础

24 篇文章 3 订阅

订阅专栏

什么是softmax的上溢和下溢问题

$\text{[math]}$

从公式可以看出，对于电脑计算指数函数exp(x)时，

如果x过于大，比如1000，则会变为inf，无穷大,这就是softmax的上溢问题；

同样，如果x过于小，比如-1000，则exp(-1000)会直接收敛为0，当softmax的分母的每一项都是0时，就是对应的softmax的下溢问题。

解决这个问题的方法就是利用softmax的冗余性。即，softmax(x-a)=softmax(x)。注明，tf.math.softmax已经默认使用了此方法来解决上溢和下溢问题。详情见：(12条消息) softmax上溢和下溢问题_会飞的猩猩。的博客-CSDN博客_softmax 下溢

但是虽然通过冗余性可以解决上溢和下溢问题，但是数值的近似化已经生成，log(exp(-1000))的结果也就不对了。

而对于softmax的结果都是在（0,1）之间，在对softmax激活函数后的结果进行交叉熵损失计算时，则很容易出现大量的0结果，从而使得结果的可靠性受到挑战，为此，出现了tf.math.log_softmax和tf.math.log_sigmoid。在模型上的体现上，例如tf.keras.losses.SparseCategoricalCrossentropy中有一个参数from_logits，其就是在将模型的最后一个激活层移动到损失函数的计算上来，从而减少数值溢出问题导致的模型可靠性不足。关于tf.keras.losses.SparseCategoricalCrossentropy的介绍，见(12条消息) tf.keras.losses.SparseCategoricalCrossentropy 学习总结_会发paper的学渣的博客-CSDN博客

特别注意如下数值问题：

tf.math.exp(tf.constant([1000.]))的结果为inf，即无穷大

tf.math.exp(tf.constant([-1000.]))的结果为0

tf.math.log(tf.constant([[1e-40]]))的结果为-inf，即负无穷小

会发paper的学渣

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
从tf.math.log_softmax和tf.keras.losses.SparseCategoricalCrossentropy看softmax的上溢和下溢问题

softmax的上溢和下溢问题
复制链接

扫一扫

专栏目录

会发paper的学渣 CSDN认证博客专家 CSDN认证企业博客

码龄13年

189: 原创

3万+: 周排名

1万+: 总排名

29万+: 访问

: 等级

2144: 积分

137: 粉丝

193: 获赞

88: 评论

853: 收藏

私信

关注

热门文章

分类专栏

elasticsearch 16篇
深度学习基础 24篇
tensorflow2.x 39篇
NLP 29篇
搜索 9篇
推荐 17篇
大模型 1篇
linux 8篇
python3 23篇
问题
模型训练 4篇
ocr 1篇
联想 2篇
neo4j 1篇
知识图谱 7篇
kafka 2篇
tfrs 1篇
pandas 2篇
加密算法 2篇
springcloud 1篇
awk 1篇
springboot继承 1篇
大数据算法 4篇
传统算法
札记 11篇
spark学习 3篇

最新评论

elasticsearch 关于向量化检索
2401_84184638: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
cube-studio 部署过程
源泉775: 道友，你弄出来了吗
wave2lip训练
weixin_45561370: 你好，请问一下你生成那三个文件了吗
数据集下载渠道汇总
m0_62196601: https://computenest.console.aliyun.com/user/dataset/cn-hangzhou 阿里云的「计算巢」产品现已更新，增添了多个热门中文数据集，以便大家能够更便捷地进行数据分析和机器学习项目。
wave2lip训练
m0_62196601: ![mar](https://baidu.com)

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

会发paper的学渣 您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。