熵、KL散度、交叉熵

最新推荐文章于 2021-04-07 22:05:51 发布

筱踏云

最新推荐文章于 2021-04-07 22:05:51 发布

阅读量263

点赞数 1

分类专栏：机器学习文章标签：交叉熵 KL散度

本文链接：https://blog.csdn.net/qq_34372112/article/details/99118390

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

绪论

最近在做实验的时候，发现机器有些基本知识真的很重要，所以就把机器学习的内容重新整理一下，本文仅从机器学习的角度来讲解熵、KL散度和交叉熵。且本文的公式都是以离散的形式来写的，方便理解。

熵

简单来说熵就是描述系统的不确定性的，就是说，一个事件越确定，那么它的熵就越小，越不确定熵就越大。熵的定义为： $-\sum_{i=1} ^n p(x_i)\log p(x_i)$ 例如：抛一枚硬币，有两种情况，正反各有 $\frac{1}{2}$ 的概率，熵为： $-\frac{1}{2}\log(\frac{1}{2})-\frac{1}{2}\log(\frac{1}{2})$ 。

KL散度

这里先忘掉前面的知识，简单来说，KL散度是描述两个分布之间的差异，比如说，我们现在有两个分布，现在想看这两个分布之间的差异，有很多种衡量的方式，计算距离等等，KL散度也是一种衡量方式，而且实践证明它比较好用，仅此而已。定义为： $D_{KL}(p||q)=\sum_{i=1}^n p(x_i)\log \frac{p(x_i)}{q(x_i)}$ 其中P和Q为两个不同的分布。在实际中，一般p为真实分布，q为近似分布，一般的任务是需要让q来接近于真实分布。另外KL散度不是距离，它不是对称的，即 $D_{KL}(p||q)$ 不等于 $D_{KL}(q||p)$

交叉熵

交叉熵跟KL散度很相似，先上公式： $q)=-\sum_{i=1}^np(x_i)\log q(x_i) = H(p)+D_{KL}(p||q)$ 从公式中可以看出，交叉熵相比KL散度就是多了一项 $H (p)$ ，如果P为真实分布的话，那么 $H (p)$ 为常数，此时，KL散度和交叉熵是等价的。那为什么我们一般用交叉熵做损失函数而不用KL散度呢？因为交叉熵的计算比KL散度要简单很多。

筱踏云

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
熵、KL散度、交叉熵

绪论最近在做实验的时候，发现机器有些基本知识真的很重要，所以就把机器学习的内容重新整理一下，本文仅从机器学习的角度来讲解熵、KL散度和交叉熵。熵简单来说熵就是描述系统的不确定性的，就是说，一个事件越确定，那么它的熵就约小，越不确定熵就越大。熵的定义为：H(x)=−∑i=1np(xi)log⁡p(xi) H(x) = -\sum_{i=1} ^n p(x_i)\log p(x_i)H(x)=−...
复制链接

扫一扫

专栏目录