【手推公式】softmax和logits

Che3rry

已于 2023-12-02 16:29:18 修改

阅读量150

点赞数 1

分类专栏：深度学习的数学基础文章标签：机器学习算法人工智能

于 2023-12-02 16:28:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caiziming_001/article/details/134754094

版权

深度学习的数学基础专栏收录该内容

5 篇文章

订阅专栏

关于sigmoid和softmax

sigmoid和softmax是神经网络输出层使用的激活函数，分别用于两类判别和多类判别。binary cross-entropy和categorical cross-entropy是相对应的损失函数。
两个函数的主要目的是对神经网络的输出logits值转化为概率。
- 下文的logits值由 $z_i$ 表示
我们这里主要讨论两个问题，为什么这两个函数 $z_i$ 越大，概率越大呢

sigmoid函数

$\frac {1} {1+exp(-z)} = {(1+exp(-z))}^{-1}$

即二分类概率 $p = f (z)$

由此， $p$ 表示的是概率，故 $p\in (0,1)$ ，其导数也是大于零的，对 $z$ 越大明显有 $p$ 越大

softmax函数

${P}_{k}=\frac {exp({z}_{k})} {\sum _{i} {exp({z}_{i})}}$

对于一个序列 ${z}_{1},...,{z}_{k},...,{z}_{n}]$ 表示神经网络的输出logits值

将其转换为概率序列 ${p}_{1},...,{p}_{k},...,{p}_{n}]$ ，从softmax公式上可以看出，本质上是做一个归一化。

由上图可以看出 ${z}_{k}$ 越大 ${p}_{k}$ 越大// ${z}_{j}$ 越大 ${p}_{k}$ 越小

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。