信息熵

最新推荐文章于 2020-09-23 14:14:44 发布

YaoTian_ml

最新推荐文章于 2020-09-23 14:14:44 发布

阅读量400

点赞数

分类专栏：一些理解和笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28012985/article/details/90815230

版权

一些理解和笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

首先需要了解一个假设。如何来定义一个信息的信息量的大小，把信息量可以看成是一个事件给人们带来的“惊讶程度”，比如一个很常见的事情发生，就认为这个事件的信息量比较小，而一个很稀有的事件发生了，那么就认为这个事件的信息量比较大。比如：太阳升起这种稀疏平常的事件，我们就认为它没有什么有效信息，约等于不说。而夏天突然天降大雪，这种小概率事件的信息，在定量描述上，我们就认为它具有更高的信息量。

信息量与事件概率的关系：1、信息量h(x)的大小与概率p(x)大小满足递减规律，当概率取1时，信息量的值应该为零，当概率趋近于0时，认为信息量区域无穷大，信息量的值应始终是大于等于零的。2、两个不相关的事件同时发生的的信息量h(x,y)应该等于两个事件单独发生的信息量之和h(x,y)=h(x)+h(y)。所以很自然的一种信息量的描述形式是：h(x) = −log2 p(x)

对于一个随机变量X来说，其平均信息量可以表示为单个概率的信息量关于分布p(X)的期望：

$H\left [ x \right ]=-\sum_{x}p(x)\log_{2}p(x)$

这就是随机变量的熵。对数的底数是无关紧要的，当以e为底时，熵的单位为nat，当以2为底时，熵的单位是bit。

熵的概念来源于物理学，是描述系统中无序度的一个概念，系统中的原子分子越杂乱无序，则熵越高。在信息学中，也包含类似的含义。一个随机变量的如果是均匀分布，则被认为是比集中取一个或几个值的状态更加‘无序’的状态，分析H(X)也可以知道，当p(X)为均匀分布时，H(x)取得最大值。

条件熵：

可以得到H(y|x)=H(x,y)-H(x)，同时也符合启发式猜想：在x的条件下y的熵等于x,y同时发生的熵减去x发生的熵。

互信息：

从贝叶斯观点来看，p(x)看成是先验概率，p(x|y)看成是后验概率，那么互信息可以看成是由于知道y的值而造成x的不确定的减少。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
信息熵

首先需要了解一个假设。如何来定义一个信息的信息量的大小，把信息量可以看成是一个事件给人们带来的“惊讶程度”，比如一个很常见的事情发生，就认为这个事件的信息量比较小，而一个很稀有的事件发生了，那么就认为这个事件的信息量比较大。比如：太阳升起这种稀疏平常的事件，我们就认为它没有什么有效信息，约等于不说。而夏天突然天降大雪，这种小概率事件的信息，在定量描述上，我们就认为它具有更高的信息量。信息量与事...
复制链接

扫一扫

专栏目录

YaoTian_ml CSDN认证博客专家 CSDN认证企业博客

码龄9年

9: 原创

113万+: 周排名

201万+: 总排名

2万+: 访问

: 等级

298: 积分

3: 粉丝

7: 获赞

3: 评论

35: 收藏

私信

关注

热门文章

分类专栏

最新评论

win10+mx150深度学习GPU加速
Lindun想要学语音: 哈哈，我是小米air i5用户，MX150玩不了GTA4但是可以跑简单的网络，也算是不浪费这块卡了。
win10+mx150深度学习GPU加速
飞天牛牛: 哈哈哈原来 MX150 还是可以的嘛这周keras 走起
win10+mx150深度学习GPU加速
YaoTian_ml 回复 pb456: 手写字体样本学习一下还是可以跑，玩深度学习的话还是需要一个桌面级显卡1060及以上吧
win10+mx150深度学习GPU加速
csdn_yuan88: 棒棒哒
win10+mx150深度学习GPU加速
SimZhou: 可以啊！比起cpu来说还是要强不少！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。