Softmax 的上下溢出问题解决方案

最新推荐文章于 2024-12-09 14:53:17 发布

氵文大师

最新推荐文章于 2024-12-09 14:53:17 发布

阅读量4k

点赞数 5

分类专栏：每日一氵文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HaoZiHuang/article/details/122616235

版权

每日一氵专栏收录该内容

162 篇文章

订阅专栏

在审核RD写的线性分类解读时，看到了这么一条：

在 Softmax 函数的计算过程中，还需要注意上溢出和下溢出的问题

之前遇到过，但都是调包来解决的，今儿看到了之后，整理如下：

给定一个张量：
$\bm{x} = [x_1, x_2, ...., x_n] ^ T$
经过 $s o f t m a x$ 函数为:
$\bm{\tilde{x}} = [\tilde{x}_1, \tilde{x}_2, ...., \tilde{x}_n] ^ T$
其中：
$\tilde{x}_k = \frac {e^{x_k}} {e^{x_1}+e^{x_2}+...+e^{x_k}+...+e^{x_n}}$

看到指数出现在分子或者分母上就害怕

函数 $y=e^x$ 中 $x$ 取超级大的正数，float32就溢出了，这个叫上溢出。
如果 $x$ 取超级小的负数， $y$ 就是 $0.000000000$ 几，超过有效数字后， $y$ 就是0了，而如果分母都是0，就出现了除0错，这个叫下溢出

这咋办??

显然，这两种情况同时出现时，只需要考虑上溢出的情况就行

先给结论吧，分子上下，同时除以 ${\color{red} max(\bm x)}$ ：
$\tilde{x}_k = \frac {e^{x_k-max(\bm x)}} {e^{x_1-max(\bm x)}+e^{x_2-max(\bm x)}+...+e^{x_k-max(\bm x)}+...+e^{x_n-max(\bm x)}}$

$max(\bm x)$ 是取张量 $\bm x$ 中的最大值

接下来简单说明下，当发生上溢出时， $x_k' = x_k-max(\bm x)$ 中最大值为0，故而避免了上溢出

而发生下溢出时， $x_k' = x_k-max(\bm x)$ 中最大值为0，分母中 $e^{x_k-max(\bm x)}$ 至少有一个为1，避免了除0错，故而避免了下溢出

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。