熵的理解_简单例子分析

最新推荐文章于 2024-01-08 01:28:01 发布

夭夭耀

最新推荐文章于 2024-01-08 01:28:01 发布

阅读量1.3k

点赞数 3

分类专栏：知识储备记录文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43210097/article/details/119924068

版权

知识储备记录专栏收录该内容

3 篇文章 0 订阅

订阅专栏

前言：

机器学习中频繁地使用到熵这个概念去对模型结果进行刻画和评估，在此稍微记录一下近两天我对熵的一些理解，有些坑已经踩了不止一次了。。。

下图引用自李宏毅教授的机器学习入门，感谢李老师，讲得的确非常好。

正文：

先上图，之后就对着这页PPT的内容说一下我的想法。

我们只讨论熵这个概念，这里不把熵和机器学习结合起来说。

首先，给出直观的理解。熵就是描述物质（对象）内部混乱程度的量。如果有这么一组数据【1，1，1，1，1】那么它就很不混乱，它的熵就是0.如果一组数据是【1，2，3，4，5】，它就表现的不一致，熵值就比前一组数据大。

然后我的问题就来了（承认自己有些时候有些呆），上图不是有三个柱状图嘛，如果按照直观的感受，第一个和第二个图它们不是分布的有差异吗？而第三个图分布得很均匀呀，为啥第三个反而熵值大呢？

这就得说一说熵的计算式了，见下方：

pi是每个事件出现的概率，对数一般取2为底，单位为比特。但是，也可以取其它对数底，采用其它相应的单位，它们间可用换底公式换算。

继续结合上文提到的数组举例，【1，1，1，1，1】中1出现的概率是100%，所以它的熵算出来是0，而【1，2，3，4，5】每个数出现的概率是20%，它的熵算出来是ln5。

回答上方提出的问题了：上方的柱状图其实展示的不是最开始的统计数据，即不是我们看到的数组，而是已经经过统计之后的每个数出现的概率了，这个概率是直接带进公式计算的，而原始数据不是。这么就能明确熵的概念及计算过程了。

说在最后：

机器学习很复杂，但难学主要还是在很多基础概念不清楚，概念都不清楚，上来就直接调包的话很容易把自己弄混的，学习东西还是要慢慢来，一步一个脚印。

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
熵的理解_简单例子分析

机器学习中频繁地使用到熵这个概念去对模型结果进行刻画和评估，在此稍微记录一下近两天我对熵的一些理解，有些坑已经踩了不止一次了。。。下图引用自李宏毅教授的机器学习入门，感谢李老师，讲得的确非常好。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。