使用Python计算离散随机变量的熵(Entropy)

最新推荐文章于 2024-01-03 15:51:47 发布

飞机火车巴雷特

最新推荐文章于 2024-01-03 15:51:47 发布

阅读量1w

点赞数 6

分类专栏： Python相关文章标签： python 熵随机变量

本文链接：https://blog.csdn.net/qq_36158230/article/details/124900489

版权

Python相关专栏收录该内容

61 篇文章 1 订阅

订阅专栏

一、离散随机变量

设 $\{x_i\}$ 为离散型随机变量 $\xi$ 的所有可能值；而 $p(x_i)$ 是 $\xi$ 取 $x_i$ 的概率，即

$P(\xi = x_i)=p(x_i), i=1,2,3,...$

则 $\{p(x_i), i=1,2,3,...\}$ 称为(离散)随机变量 $\xi$ 的概率分布，而且它满足下面的条件：

$p(x_i)\geqslant 0, i=1,2,3,...$

$\sum_{i=1}^{\infty}p(x_i)=1$

在现实中，通常这个随机变量 $\xi$ 的取值个数是可数的。这里假设随机变量 $\xi$ 的取值个数为 $N$ 个，那么随机变量 $\xi$ 的概率分布可以表示为

$\{p(x_1), p(x_2),...,p(x_N)\}$

可见，这是一个集合。而在Python中，可以这认为是一个列表(list)。换句话说，在熵时，我们需要传入一个list这样的数据格式。

二、熵的计算公式

假设具有 $N$ 个取值个数的随机变量 $\xi$ 的概率分布为 $\{p(x_1), p(x_2),...,p(x_N)\}$ ，那么随机变量 $\xi$ 的熵被定义为

$\mathbb{H}(\xi)\triangleq -\sum_{i=1}^{N}p(x_i)\log_2{p(x_i)}$

通常使用以2为底的对数函数。

三、使用scipy.stats.entropy计算

scipy.stats.entropy提供了一种熵的计算方法，其中的对数函数的底默认为自然数e，也可以指定具体的底。调用方法为

from scipy.stats import entropy

entropy_a = entropy([0/9, 0/9, 9/9])
entropy_b = entropy([1/999, 1/999, 997/999])
entropy_c = entropy([0/9, 1/9, 8/9])
entropy_d = entropy([1/9, 3/9, 5/9])
entropy_e = entropy([1/3, 1/3, 1/3])
entropy_f = entropy([1/3, 1/3, 1/3], base=2)

print(entropy_a)
print(entropy_b)
print(entropy_c)
print(entropy_d)
print(entropy_e)
print(entropy_f)

四、计算结果

0.0
0.01582733355150361
0.34883209584303193
0.9368883075390159
1.0986122886681096
1.584962500721156

五、参考

李贤平，概率论基础[M]，高等教育出版社

Kevin P. Murphy，Machine Learning A Probabilistic Perspective，The MIT Press

scipy.stats.entropy — SciPy v1.8.1 Manual

飞机火车巴雷特

关注

6
点赞
踩
20

收藏

觉得还不错? 一键收藏
打赏
0
评论
使用Python计算离散随机变量的熵(Entropy)

通过SciPy库在Python中计算离散随机变量的熵
复制链接

扫一扫

专栏目录