一些信息熵的含义

最新推荐文章于 2022-10-17 20:25:24 发布

Gzzgz

最新推荐文章于 2022-10-17 20:25:24 发布

阅读量4.5k

点赞数

分类专栏： Statistics & Machine Learning

Statistics & Machine Learning 专栏收录该内容

24 篇文章 0 订阅

订阅专栏

http://blog.csdn.net/KXY_tech/article/details/3993457

一些信息熵的含义

(1) 信息熵的定义：假设X是一个离散随即变量，即它的取值范围R={x₁，x₂...}是有限可数的。设p_i=P{X=x_i}，X的熵定义为：

(a)

若(a)式中，对数的底为2，则熵表示为H₂(x)，此时以2为基底的熵单位是bits，即位。若某一项p_i=0，则定义该项的p_ilogp_i^-1为0。

(2) 设R={0,1}，并定义P{X=0}=p，P{X=1}=1-p。则此时的H(X)=-plogp-(1-p)log(1-p)。该H(x)非常重要，称为熵函数。熵函数的的曲线如下图表示：

再者，定义对于任意的x∈R，I(x)=-logP{X =x}。则H(X)就是I(x)的平均值。此时的I(x)可视为x所提供的信息量。I(x)的曲线如下：

(3) H(X)的最大值。若X在定义域R={x₁,x₂,...x_r}，则0<=H(X)<=logr。

(4) 条件熵：定义

推导：H(X|Y=y)= ∑p(x|y)log{1/p(x,y)}

H(X|Y)=∑p(y)H(X|Y=y)= ∑p(y)*∑p(x|y)log{1/p(x/y)}

H(X|Y)表示得到Y后，X的平均信息量，即平均不确定度。

(5) Fano不等式：设X和Y都是离散随机变量，都取值于集合{x₁,x₂,...x_r}。则

H(X|Y)<=H(Pe)+Pe*log(r-1)

其中Pe=P{X≠Y}。Fano表示在已经知道Y后，仍然需要通过检测X才能获得的信息量。检测X的一个方法是先确定X=Y。若X=Y，就知道X；若X≠Y，那么还有r-1个可能。

(6) 互信息量：I(X;Y)=H(X)-H(X|Y)。I(X;Y)可以理解成知道了Y后对于减少X的不确定性的贡献。

I(X;Y)的公式：

I(X;Y)=∑_(x,y)p(x,y)log{p(y|x)/p(y)}

(7) 联合熵定义为两个元素同时发生的不确定度。

联合熵H(X,Y)= ∑_(x,y)p(x,y)logp(x,y)=H(X)+H(Y|X)

(8) 信道中互信息的含义

互信息的定义得：

I(X,Y)=H(X)-H(X|Y)= I(Y,X)=H(Y)-H(Y|X)

若信道输入为H(X)，输出为H(Y)，则条件熵H(X|Y)可以看成由于信道上存在干扰和噪声而损失掉的平均信息量。条件熵H(X|Y)又可以看成由于信道上的干扰和噪声的缘故，接收端获得Y后还剩余的对符号X的平均不确定度，故称为疑义度。

条件熵H(Y|X)可以看作唯一地确定信道噪声所需要的平均信息量，故称为噪声熵或者散布度。

(9) I(X,Y)的重要结论

互信息

互信息I(X,Y)只是输入信源X的概率分布P(x_i)和信道转移概率P(y_j|x_i)的函数，可以证明当P(x_i)一定时，I是关于P(y_j|x_i)的∪函数，存在极小值；当P(y_j|x_i)一定时，I是关于P(x_i)的∩函数，存在极大值。

(10) 联合熵、条件熵的关系图。H(X)>=H(X|Y)，H(Y)>=H(Y|X)。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
一些信息熵的含义

http://blog.csdn.net/KXY_tech/article/details/3993457一些信息熵的含义(1) 信息熵的定义：假设X是一个离散随即变量，即它的取值范围R={x1，x2...}是有限可数的。设pi=P{X=xi}，X的熵定义为： (a)若(a)
复制链接

扫一扫

专栏目录

Gzzgz CSDN认证博客专家 CSDN认证企业博客

码龄13年

39: 原创

18万+: 周排名

56万+: 总排名

13万+: 访问

: 等级

1765: 积分

61: 粉丝

33: 获赞

12: 评论

37: 收藏

私信

关注

热门文章

分类专栏

最新评论

表情识别数据
晨晖将歇: 您好，请问您有AVEC2013的数据集吗，我现在在做抑郁识别方向，但是AVEC2013官网已经进不去了
Canny
qq_30946231: 你好，您说的关于双阈值的选择讨论在哪里呀0.0
windows下编译Matconvnet的方法(CPU和GPU)
m0_37918506: 博主，你好！我在用cifar-10测试时出现这个问题，一直未能解决，希望能得到你的帮助！ train: epoch 01: 1/500: 99.4 (99.4) Hz objective: 3.010 top1err: 0.880 top5err: 0.580 train: epoch 01: 2/500:Error using fliplr (line 18) X must be a 2-D matrix. Error in cnn_cifar>getSimpleNNBatch (line 79) if rand > 0.5, images=fliplr(images) ; end Error in cnn_cifar>@(x,y)getSimpleNNBatch(x,y) (line 68) fn = @(x,y) getSimpleNNBatch(x,y) ; Error in cnn_train>processEpoch (line 325) [im, labels] = params.getBatch(params.imdb, batch) ; Error in cnn_train (line 150) [net, state] = processEpoch(net, state, params, 'train') ; Error in cnn_cifar (line 57) [net, info] = trainfn(net, imdb, getBatch(opts), ... >>
windows下编译Matconvnet的方法(CPU和GPU)
fanxinory: cuda6.5以上的计算能力要求是3.0
Caffe for windows 训练cifar10数据集
: 我换了分类器解决了没用这个classification.cpp

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。