Softmax， stable softmax, cross entropy loss

最新推荐文章于 2024-12-09 19:17:22 发布

*小呆

最新推荐文章于 2024-12-09 19:17:22 发布

阅读量661

点赞数 1

分类专栏： python_numpy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39575835/article/details/88693179

版权

python_numpy 专栏收录该内容

6 篇文章

订阅专栏

博客主要介绍了softmax公式，它是一种平滑的归一化，会给较大数值更大权重，但可能导致溢出问题。为避免溢出，引出了stable softmax，通过分子分母同乘一个数化简实现。此外，还给出了cross entropy loss的参考链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.softmax 公式：

python：

def softmax(X):

    exps = np.exp(X) 

    return exps / np.sum(exps)

对于softmax理解，就是一种平滑的归一化。假如我们使用线性的归一化，就很均匀，softmax相当于给比较大的数值大的权重，比如python里面：

plt.plot(range(1, 20), np.exp(range(1, 20)))

np.exp(20) = 485165195.40979028

越大的数占的得权重就越大。

这样造成一个问题，如果某个数比较大，可以参考https://blog.csdn.net/qq_39575835/article/details/88239982

最大也就 1.7x10^308这么大，所以为了避免溢出，stable softmax 就出来了

2.stable softmax

分子分母同乘一个数，比值不变。一般而言C= max（sample）

python 代码就是

def stable_softmax(X): 

    exps = np.exp(X - np.max(X)) 

    return exps / np.sum(exps)

化简步骤如下：

我在图中标注的M 是一个常数，大家一般都用 - max（x）来约束。所以stable softmax两行代码就撸完了。

3.cross entropy loss

reference:
https://deepnotes.io/softmax-crossentropy

https://blog.csdn.net/u014380165/article/details/77284921

博客等级

码龄8年

167
原创

341
点赞

1164
收藏

106
粉丝

关注

私信

分类专栏

实用技巧 20篇
docker 5篇
Statistical Learning 7篇
找工作 3篇
weakly supervise segmentation 4篇
python_tensorflow 3篇
python_numpy 6篇
python3 33篇
cuda 8篇
vs 3篇
ffmpeg 12篇
deep learning 56篇
c++ 16篇
torch 24篇
segmentation 4篇

最新评论

sliding windows infer 模型
满船清梦压星河QAQ: stride[0]和stride[1]不应该加
sliding windows infer 模型
满船清梦压星河QAQ: 双循环边界条件有问题，会溢出
win10 cuda_小白之旅（2）：第一个应用程序
weixin_44811466: 我也遇到这样的问题，但是我的断网后才可以正常运行，请问你现在解决了吗？
[win 10] maskrcnn-benchmark 上手（1）——配置环境与coco数据集介绍
qq_43334087: 你好博主，还是不太理解iscrow=1有啥用，是用于表示语义分割把一类事物全部划成一个整体吗？还是说只是粘在一起的物体划成整体，分散开来的依然是一个个分开？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。