【数学笔记】信息论基础

最新推荐文章于 2023-02-24 22:17:01 发布

RealWeakCoder

最新推荐文章于 2023-02-24 22:17:01 发布

阅读量2.2k

点赞数 2

分类专栏：数学文章标签：熵信息论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/realcoder/article/details/113805607

版权

数学专栏收录该内容

3 篇文章 0 订阅

订阅专栏

信息消除不确定性，不确定性由熵描述

随机变量的熵：
设 $X$ 为随机变量，其分布为 $P (X)$
则 $X$ 的熵为：
$H(X)=-\sum_{x\in X}P(x)\log_{2}{P(x)}$

随机变量的条件熵：
已知随机变量 $X, Y$ ，联合分布 $P (X, Y)$ ,条件分布 $P (X ∣ Y)$
则在 $Y$ 的条件下 $X$ 的条件熵为：
$H(X|Y)=-\sum_{x\in X,y\in Y}P(x,y)\log_{2}{P(x|y)}$

可证明 $H (X) \geq H (X ∣ Y)$

互信息:
假定两个随机事件 $X$ , $Y$ ，他们的互信息定义为：
$I(X;Y)=\sum _{x\in X,y\in Y}P(x,y)\log_{2}\frac{P(x,y)}{P(x)P(y)}$
互信息描述了两个随机事件的相关性
实际上，互信息由
$I (X; Y) = H (X) - H (X ∣ Y)$
导出。

库尔贝克——莱伯勒相对熵：
衡量两个取值为正数的函数的相似性
$KL(f(x)||g(x))=\sum_{x\in X}f(x)\log_2\frac{f(x)}{g(x)}$

两个完全相同的函数，其相对熵为0
相对熵越大，两个函数差异越大
对于概率分布或者概率密度函数，如果取值均大于0，相对熵可以度量两个随机分布的差异性

詹森——香农相对熵：
注意到库尔贝克——莱伯勒相对熵是不对称的，进行对称平均对其修正，得到：
$JS(f(x)||g(x))=\frac{1}{2}[KL(f(x)||g(x))+KL(g(x)||f(x))]$

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。