【Python深度学习】——交叉熵|KL散度|交叉熵损失函数

最新推荐文章于 2024-07-27 12:20:46 发布

steptoward

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量797

点赞数 25

分类专栏：点云深度学习文章标签： python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/steptoward/article/details/139576282

版权

点云深度学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

【Python深度学习】——交叉熵|KL散度|交叉熵损失函数

1. 交叉熵Cross Entropy
2. KL散度
3. 交叉熵损失函数
- 3.1 交叉熵损失函数的定义与公式

1. 交叉熵Cross Entropy

1.1 交叉熵的含义

交叉熵是两个概率分布之间差异的一种度量.
在机器学习中被广泛应用，尤其是分类问题中。

1.2 交叉熵的公式

$-\sum_{i} P(x_i) \log Q(x_i)$
其中, $P(x_i)$ 是真实分布中第 ( i ) 个事件的概率;
$Q(x_i)$ 是模型预测分布中第 ( i ) 个事件的概率。

1.3 交叉熵的特点

当模型的预测分布 𝑄 越接近真实分布 𝑃 时，交叉熵值越小。
交叉熵的值总是大于系统真实熵的值。

2. KL散度

2.1 KL散度的含义

KL散度也称为相对熵, 它也是度量两个概率分布之间差异的一种方式. 它是以Kullback和Leibler两个人命名的.

2.2 KL散度的公式

假设有两个概率分布 𝑃 和 𝑄，其中 𝑃 是真实分布，𝑄 是模型的预测分布。KL散度表示二者的交叉熵与熵的差:
$D_{KL}(P \parallel Q) = H(P, Q) - H(P)$
代入之前交叉熵和熵的公式, 可以得出:
$D_{KL}(P \parallel Q) = -\sum_{i} P(x_i) \log Q(x_i) - \left( -\sum_{i} P(x_i) \log P(x_i) \right)$
合并化简得到:
$D_{KL}(P \parallel Q) = \sum_{i} P(x_i) \log \frac{P(x_i)}{Q(x_i)}$

2.3 KL散度的性质

非负性
$D_{KL}(P \parallel Q) \geq 0$
当且仅当 𝑃 = 𝑄 时，
$D_{KL}(P \parallel Q) = 0 \iff P = Q$
非对称性:
$D_{KL}(P \parallel Q) \neq D_{KL}(Q \parallel P)$

KL散度遵循Jensen不等式，其推导基于凸函数的性质。对数函数是凹函数，因此：
$D_{KL}(P \parallel Q) \geq 0$

2.4 KL散度的常用场景

KL散度广泛应用于很多机器学习算法中,如变分自编码器、生成对抗网络等。它可以作为目标函数来优化模型参数,从而提高模型性能。

3. 交叉熵损失函数

交叉熵损失函数（Cross-Entropy Loss Function）是机器学习中常用的一种损失函数，特别适用于训练神经网络的二分类、多分类问题。它通过比较实际的标签分布与模型预测的概率分布，衡量模型预测的准确性。

3.1 交叉熵损失函数的定义与公式

交叉熵损失函数的目标是最小化预测概率分布与真实分布之间的差异。对于真实分布P 和预测分布 𝑄，交叉熵
𝐻(𝑃,𝑄) 的定义为
$\hat{y}) = -\sum_{i=1}^{K} y_i \log \hat{y}_i$

$y_{i}$ 是实际标签的独热编码（one-hot encoding）如果真实类别是 𝑖，则 $y_{i}=1$ , 其余为 0;
$\hat y_{i}$ 是模型预测的类别 𝑖 的概率。

关注

25
点赞
踩
26

收藏

觉得还不错? 一键收藏
打赏
0
评论
【Python深度学习】——交叉熵|KL散度|交叉熵损失函数

交叉熵损失函数的目标是最小化预测概率分布与真实分布之间的差异。对于真实分布P 和预测分布 𝑄，交叉熵𝐻(𝑃,𝑄) 的定义为Lyy−∑i1Kyilog⁡yiLyy−i1∑Kyilogyiyiy_{i}yi是实际标签的独热编码（one-hot encoding）如果真实类别是 𝑖，则yi1y_{i}=1yi1, 其余为 0;yi\hat y_{i}yi是模型预测的类别 𝑖 的概率。
复制链接

扫一扫

专栏目录

博客等级

码龄7年

56
原创

595
点赞

600
收藏

415
粉丝

关注

私信

热门文章

分类专栏

最新评论

【基于深度学习方法的激光雷达点云配准系列之GeoTransformer】——模型部分浅析(1)
steptoward: 好的呀! 最近正在整理我在自己的数据集上的微调经验, 整理好了就会发出来, 一起学习进步咯~
【基于深度学习方法的激光雷达点云配准系列之GeoTransformer】——模型部分浅析(1)
无问吉凶，但思善恶: 佬，希望你能把这个网络的结构分析出完，最近刚开始看这个网络
【Python深度学习】——使用Logging记录模型训练过程
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
【基于深度学习方法的激光雷达点云配准系列之GeoTransformer】——数据部分梳理（1）
steptoward: 感谢支持~ 模型部分的浅析已出, https://blog.csdn.net/steptoward/article/details/140018538?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22140018538%22%2C%22source%22%3A%22steptoward%22%7D, 欢迎了解,共同进步!
【基于深度学习方法的激光雷达点云配准系列之GeoTransformer】——数据部分梳理（1）
XWL的暖男: 楼主你好，非常高兴能看到你写的内容，对我帮助很大。请问下次更新是多久呢

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

steptoward 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。