熵和条件熵

最新推荐文章于 2023-06-25 21:33:50 发布

cx元

最新推荐文章于 2023-06-25 21:33:50 发布

阅读量352

点赞数

分类专栏： nlp 文章标签：算法机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45436365/article/details/126305502

版权

nlp 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1、问题描述

在读李航的《统计机器学习》第六章最大熵模型时看到一个矛盾的地方：
关于熵的描述：

$H(P)=-\sum_{i}^{n}P(x_i)logP(x_i)$

而定义在条件概率分布 $P (Y ∣ X)$ 上的条件熵又写为：

$H(P)=-\sum_{x,y}\tilde{P}(x)P(y|x)logP(y|x)$

但是按照我的理解应该写为：

$H(P)=-\sum_{x,y}P(y|x)logP(y|x)$

感觉书本上的公式多了个 $\tilde{P}(x)$ 项。查阅资料发现我还是太浅薄了哈哈数学不行，没有真正理解 $H (P)$ 的含义。

2、公式推导

条件熵 $H (Y ∣ X)$ 表示在已知随机变量 $X$ 的条件下随机变量 $Y$ 的不确定性。条件熵 $H (Y ∣ X)$ 定义为 $X$ 给定条件下 $Y$ 的条件概率分布的熵对 $X$ 的数学期望：

$H(Y|X)=\sum_{x}p(x)H(Y|X=x) \\=-\sum_{x}p(x)\sum_{y}p(y|x)logp(y|x) \\=-\sum_{x}\sum_{y}p(x)p(y|x)logp(y|x) \\=-\sum_{x,y}p(x)p(y|x)logp(y|x) \\=-\sum_{x,y}p(x,y)logp(y|x)$

其实化简到倒数第二步已经和书本上一样了，最后一步是因为 $p (y ∣ x) p (x) = p (x, y)$ .
重要的是要理解 $H(Y|X)=\sum_{x}p(x)H(Y|X=x)$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
熵和条件熵

《统计机器学习》第六章最大熵模型，对和熵有关的公式的解惑
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。