两个概率分布之间的差异描述

最新推荐文章于 2024-09-12 19:02:20 发布

MARK1998_L

最新推荐文章于 2024-09-12 19:02:20 发布

阅读量308

点赞数 4

文章标签：算法

本文链接：https://blog.csdn.net/weixin_44506510/article/details/140494134

版权

描述两个概率分布之间的差异可以通过多种方式进行，具体取决于分析的上下文和目的。以下是一些常见的方法：

Kullback-Leibler (KL) 散度：
KL散度是衡量两个概率分布 ( P ) 和 ( Q ) 差异的一种方法，它是非对称的，即 ( D_{\text{KL}}(P \parallel Q) \neq D_{\text{KL}}(Q \parallel P) )。定义为：
[ D_{\text{KL}}(P \parallel Q) = \sum_{x} P(x) \log \left(\frac{P(x)}{Q(x)}\right) ]
对于连续变量，求和会变成积分。
Jensen-Shannon 距离：
Jensen-Shannon距离是KL散度的一种对称版本，定义为：
[ JSD(P \parallel Q) = \frac{1}{2} D_{\text{KL}}(P \parallel M) + \frac{1}{2} D_{\text{KL}}(Q \parallel M) ]
其中 ( M = \frac{1}{2} (P + Q) )。
Wasserstein 距离（也称为地球移动距离）：
Wasserstein 距离衡量了将一个概率分布转换为另一个分布所需的“成本”，定义为：
[ W(P, Q) = \inf_{\gamma \in \Pi(P, Q)} \mathbb{E}_\gamma[|X - Y|] ]
其中 ( \Pi(P, Q) ) 是 ( P ) 和 ( Q ) 之间的所有联合分布的集合，( X ) 和 ( Y ) 是从这些联合分布中抽取的随机变量。
Hellinger 距离：
Hellinger 距离是另一种衡量概率分布差异的方法，定义为：
[ H^2(P, Q) = \frac{1}{2} \sum_{x} (\sqrt{P(x)} - \sqrt{Q(x)})^2 ]
对于连续变量，求和会变成积分。
Total Variation 距离：
总变差距离是衡量两个概率分布 ( P ) 和 ( Q ) 差异的一种方法，定义为：
[ TV(P, Q) = \frac{1}{2} \sum_{x} |P(x) - Q(x)| ]
对于连续变量，求和会变成积分。
Cosine 相似度：
尽管通常用于衡量向量之间的相似性，但余弦相似度也可以用于概率分布，定义为：
[ \text{Cosine}(P, Q) = 1 - \frac{\sum_{x} (P(x) - Q(x))^2}{\sqrt{\sum_{x} (P(x) - \overline{P})^2} \sqrt{\sum_{x} (Q(x) - \overline{Q})^2}} ]
其中 ( \overline{P} ) 和 ( \overline{Q} ) 是 ( P ) 和 ( Q ) 的期望值。
概率分布的方差和偏度：
方差和偏度是衡量分布形态的统计量，可以用来描述分布的集中趋势和对称性。
Radon-Nikodym 导数：
如果两个概率分布 ( P ) 和 ( Q ) 绝对连续，Radon-Nikodym导数 ( \frac{dQ}{dP} ) 可以用来描述 ( Q ) 相对于 ( P ) 的局部变化率。