机器学习与文本中的各种熵

最新推荐文章于 2021-09-27 23:35:59 发布

水煮洋洋洋

最新推荐文章于 2021-09-27 23:35:59 发布

阅读量981

点赞数 2

分类专栏：机器学习文章标签：机器学习交叉熵 kl距离信息熵信息论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43526820/article/details/89460597

版权

认识各种熵

熵

熵

假如一个朋友告诉你外面下雨了，你也许觉得不怎么新奇，因为下雨是很平常的一件事情，但是如果他告诉你他见到外星人了，那么你就会觉得很好奇: 真的吗?外星人长什么样?同样两条信息，一条信息量很小，一条信息量很大，很有价值。我们可以用熵来度量生活中的各个信息量。

信息熵

那么怎么量化上面所说的这个价值呢?这就需要信息熵，一个随机变量 X 的信息熵定义如下：
$-\sum_{x\epsilon X}p(x)\log p(x)$

信息越少，事件(变量)的不确定性越大，它的信息熵也就越大，搞明白该事件所需要的额外信息就越多，也就是说搞清楚小概率事件所需要的额外信息较多，比如说，为什么大多数人愿意相信专家的话，因为专家在他专注的领域了解的知识(信息量)多，所以他对某事件的看法较透彻，不确定性就越小，那么他所传达出来的信息量就很大，听众搞明白该事件所需要的额外信息量就很小。总之，记住一句话: 信息熵表示的是不确定性的度量。信息熵越大，不确定性越大。

联合熵与条件熵

联合熵的定义为：
$-\sum_{x\epsilon X,y\epsilon Y}p(x,y)\log{p(x,y)}$

联合熵描述的是一对随机变量X和 Y的不确定性。

条件熵的定义为：
$-\sum_{x\epsilon X,y\epsilon Y}p(x,y)\log{p(y|x)}$
条件熵衡量的是 : 在一个随机变量 X 己知的情况下，另一个随机变量Y 的不确定性。

相对熵，互信息，交叉熵

相对熵(又叫 KL 距离，信息增益) 的定义如下：

$D_{KL}(p||q) = \sum_{x\epsilon X}p(x)\log{\frac{p(x)}{q(x)}}$

最低0.47元/天解锁文章

水煮洋洋洋

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习与文本中的各种熵

认识各种熵熵信息熵联合熵与条件熵相对熵，互信息，交叉熵文本中的熵熵为什么用log熵假如一个朋友告诉你外面下雨了，你也许觉得不怎么新奇，因为下雨是很平常的一件事情，但是如果他告诉你他见到外星人了，那么你就会觉得很好奇: 真的吗?外星人长什么样?同样两条信息，一条信息量很小，一条信息量很大，很有价值。我们可以用熵来度量生活中的各个信息量。信息熵那么怎么量化上面所说的这个价值呢?这就需要...
复制链接

扫一扫

专栏目录

水煮洋洋洋 CSDN认证博客专家 CSDN认证企业博客

码龄6年

12: 原创

74万+: 周排名

127万+: 总排名

5万+: 访问

: 等级

624: 积分

35: 粉丝

47: 获赞

9: 评论

444: 收藏

私信

关注

热门文章

分类专栏

最新评论

四种常用聚类及代码（一）：K-Means
说话声音扁扁的: 可以请教一下为什么使用欧氏距离作为相似度衡量只能得到凸聚类吗
四种常用聚类及代码（一）：K-Means
柴柴的小记: 数据集可以提供吗
对话系统简介
weixin_42001089: 最新开放领域对话系统综述:https://mp.weixin.qq.com/s/ICzDwMbC5FVkFzVOuL9pIA
四种常用聚类及代码（一）：K-Means
Mr.Wednesday6: 为啥我用这个代码出现了0x763746D2这个报错，直接断了
四种常用聚类及代码（一）：K-Means
doctor_xin: 计算这个中心点跟其他点的距离与其他中心点跟其他点的距离比较，进行簇的划分。如果还是一个那这个点使离群点，就将他取出单独分析

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。