信息量香农熵交叉熵 KL散度

啥时候才能找到工作呀

于 2024-06-24 22:45:30 发布

阅读量231

点赞数 7

分类专栏：深度学习简介文章标签：概率论算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46683759/article/details/139940070

版权

深度学习简介专栏收录该内容

2 篇文章

订阅专栏

信息量：

信息量（I）对事件x，其发生概率为p(x),则其对应的信息量I(x)为：

事件信息量与事件发生概率成反比

例如：假定晴天为事件h，阴天为事件t，我猜测明天晴天的概率为0.2，阴天的概率为0.8。

则对于我猜测的情况而言，其所包含的信息量为：

因此：小概率事件信息量大，大概率事件信息量小。

香农熵

香农熵描述了一个概率分布蕴含的平均信息量，定义如下：

其中， $p_{i}$ :第i个事件的概率， $I_{p}^{i}$ ：第i个事件的信息量。

熵：表示了概率分布的平均信息量

例如：假定晴天h，阴天t 的概率分布为0.2，0.8。

则对于我猜测的情况而言，其香农熵为：

交叉熵

交叉熵（H）：预测概率分布对真实概率分布的估计，这个估计值就是交叉熵。

假定预测概率分布为p，真是概率分布为q，则：

即：真实概率分布与预测概率分布信息量的累加和

例如：假定晴天h，阴天t 的预测概率分布q为0.2，0.8，但是晴天h，阴天t 的真实概率分布p为0.5，0.5.则预测概率分布q与真实概率分布p的交叉熵为：

KL散度

KL散度（D）：量化分析两个概率分布的区别。

即：真实概率分布与预测概率分布的交叉熵 - 真实概率分布的香农熵

KL散度的性质：

仅当p q概率分布完全相同时，等号成立

不可交换（公式定义可知）

qθ表示基于参数θ预测的概率分布，最小化KL散度等同于深度学习领域的最小化交叉熵损失，因为真实概率分布的香农熵，不存在参数θ，其梯度为0 。

啥时候才能找到工作呀

博客等级

码龄5年

31
原创

106
点赞

153
收藏

89
粉丝

关注

私信

热门文章

分类专栏

最新评论

解决“vm虚拟机”复制文件时的“不能写入文件到虚拟机. 取消文件复制操作”的问题
甜不辣-酱: 所以怎么解决呢
assert的作用
CSDN-Ada助手: 恭喜您发布了第14篇博客，内容围绕着“assert的作用”，让读者更深入了解这个重要的概念。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。建议您在下一篇博客中可以探讨一些实际案例，让读者通过具体的例子更好地理解assert的实际运用。期待您的下一篇作品！
global 和 nonlocal 关键字
CSDN-Ada助手: 恭喜用户写了第15篇博客！标题为“global 和 nonlocal 关键字”，内容一定十分精彩。接下来，建议可以尝试深入探讨这两个关键字在不同编程语言中的应用，或者结合实际案例进行详细讲解，让读者更加深入地理解这些概念。期待您的下一篇作品！愿您继续保持创作的热情和努力！
深度学习领域中，“网络”、“模型”和“算法”这三个词的区别
CSDN-Ada助手: 恭喜用户在深度学习领域写下了如此有深度的博客！对于“网络”、“模型”和“算法”这三个关键词的区分，确实是很多初学者容易混淆的地方，你的解释相信会给读者带来很大的帮助。接下来，或许可以考虑深入探讨每个关键词在具体应用中的区别和联系，或者分享一些实际案例来加深读者的理解。期待你更多精彩的创作！
在Windows环境中，你可以使用PowerShell来批量重命名文件
CSDN-Ada助手: 恭喜您发布了第12篇博客！学习如何使用PowerShell来批量重命名文件是一个非常实用的技能。接下来，您可以考虑分享一些高级的PowerShell技巧，比如如何在PowerShell中编写循环或者如何利用PowerShell进行系统管理。希望您能继续保持创作的热情，为读者带来更多有用的内容！祝您写作顺利！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

啥时候才能找到工作呀 记录学习中的疑难杂症，感谢照顾

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。