Kullback-Leibler Divergence （KL 散度）

最新推荐文章于 2024-05-27 22:29:09 发布

SilenceHell

最新推荐文章于 2024-05-27 22:29:09 发布

阅读量276

点赞数

分类专栏：矩阵相关知识

矩阵相关知识专栏收录该内容

9 篇文章 1 订阅

订阅专栏

转载自：https://blog.csdn.net/matrix_space/article/details/80550561

今天，我们介绍机器学习里非常常用的一个概念，KL 散度，这是一个用来衡量两个概率分布的相似性的一个度量指标。我们知道，现实世界里的任何观察都可以看成表示成信息和数据，一般来说，我们无法获取数据的总体，我们只能拿到数据的部分样本，根据数据的部分样本，我们会对数据的整体做一个近似的估计，而数据整体本身有一个真实的分布（我们可能永远无法知道），那么近似估计的概率分布和数据整体真实的概率分布的相似度，或者说差异程度，可以用 KL 散度来表示。

KL 散度，最早是从信息论里演化而来的，所以在介绍 KL 散度之前，我们要先介绍一下信息熵。信息熵的定义如下：

H=&#x2212;&#x2211;i=1Np(xi)log&#x2061;p(xi)” role=”presentation” style=”text-align: center; position: relative;”> H = - \sum i = 1 N p (x i) log p (x i)

p(xi)” role=”presentation” style=”position: relative;”>p(xi) 发生的概率，信息熵其实反映的就是要表示一个概率分布需要的平均信息量。

在信息熵的基础上，我们定义 KL 散度为：

DKL(p||q)=&#x2211;i=1Np(xi)&#x22C5;(log&#x2061;p(xi)&#x2212;log&#x2061;(q(xi))” role=”presentation” style=”text-align: center; position: relative;”> D K L (p | | q) = \sum i = 1 N p (x i) \cdot (log p (x i) - log (q (x i))

或者表示成下面这种形式：

DKL(p||q)=&#x2211;i=1Np(xi)&#x22C5;log&#x2061;p(xi)q(xi)” role=”presentation” style=”text-align: center; position: relative;”> D K L (p | | q) = \sum i = 1 N p (x i) \cdot log p ( x i ) q ( x i )

DKL(p||q)” role=”presentation” style=”position: relative;”>DKL(p||q) 之间越接近，那么估计的概率分布于真实的概率分布也就越接近。

KL 散度可以帮助我们选择最优的参数，比如 p(x)” role=”presentation” style=”position: relative;”>p(x) 个样本，构建如下的目标函数：

DKL(p||q)=&#x2211;i=1N{log&#x2061;p(xi)&#x2212;log&#x2061;q(xi|&#x03B8;)}” role=”presentation” style=”text-align: center; position: relative;”> D K L (p | | q) = \sum i = 1 N {log p (x i) - log q (x i | θ)}

因为我们要预估的是参数 θ” role=”presentation” style=”position: relative;”>θ，而这个就是我们熟悉的最大似然估计。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Kullback-Leibler Divergence （KL 散度）

转载自：https://blog.csdn.net/matrix_space/article/details/80550561 今天，我们介绍机器学习里非常常用的一个概念，KL 散度，这是一个用来衡量两个概率分布的相似性的一个度量指标。我们知道，现实世界里的任何观察都可以看成表示成信息和数据，一般来说，我们无法获取数据的总体，我们只能拿到数据的部分样本，根据数据...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。