机器学习——信息熵

最新推荐文章于 2022-08-16 13:11:47 发布

weixin_30449239

最新推荐文章于 2022-08-16 13:11:47 发布

阅读量463

点赞数

文章标签：人工智能数据结构与算法

原文链接：http://www.cnblogs.com/miaoqianling/p/11441460.html

版权

信息熵在信息论中代表的是随机变量的不确定度的度量
　　1、熵越大，数据的不确定性越高，无规则运动越剧烈
　　2、熵越小，数据的不确定性越低

信息熵公式：
　　

式子表示这个样本中有k类，pi表示第i类数据在总体中的占比。

负号是因为pi属于0到1之间，那么log（pi）就小于零，所以加一个负号。

举个栗子：

　　可以看到后一个的熵要小，后一个数据比前一个数据更加确定。

划分的目的：
　　使得划分后信息熵降低

　　对所有的划分可能性进行搜索，找到最优划分方式，生成决策树

转载于:https://www.cnblogs.com/miaoqianling/p/11441460.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30449239

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

机器学习与信息论之熵

花梦飞的博客

12-16

680

在机器学习中，我们经常提到熵的概念。例如我们经常使用交叉熵衡量目标（target）与预测值（real）之间的差距，使用KL散度（也称作相对熵）衡量两个概率分布之间的距离。交叉熵和相对熵这些概念其实都来自于信息论，并且自我认为机器学习本身也是对样本信息的学习，另外最近在研究GAN模型和VAE模型（也就是我们常说的生成模型）时，经常会使用到，所以有必要将其单独拿出来作为我学习的一个记录。要了解交叉...

机器学习算法——信息熵

LuciferCode的博客

04-12

6989

信息熵(Entropy) 信息是个很抽象的概念。我们常常说信息很多，或者信息较少，但却很难说清楚信息到底有多少。比如一本书中到底有多少信息量。直到 1948 年，香农（C. E. Shannon）提出了“信息熵”(shāng) 的概念，才解决了对信息的量化度量问题。熵的概念发展成为信息论、数据压缩等学科的基础，在很多科学研究的领域尤其是计算机科学中有着广泛的应用。实际上，一条信息的信息量

参与评论您还未登录，请先登录后发表或查看评论

机器学习之信息熵

纸上得来终觉浅，绝知此事要躬行

04-24

612

首先我们要区分信息量和信息熵的区别。下面根据我的理解一步一步引出信息熵及其公式的来源： 信息熵的公式先抛出信息熵公式如下：其中 p(xi) 代表随机事件X为 xi的概率，下面来逐步介绍信息熵的公式来源！信息量信息量是对信息的度量，就跟时间的度量是秒一样，当我们考虑一个离散的随机变量x的时候，当我们观察到的这个变量的一个具体值的时候，我们接收到了多少信息呢？多少信息用信息量...

机器学习（一）基本概念与信息熵

mystery_guest的博客

09-01

766

慢慢来入手机器学习吧。基本概念网上或者书中都有一大堆，理解个大概就行，至少懂得一些专业术语，以便于之后能够在神经网络的学习中至少能看懂。 信息熵。。。这是什么东西呢？相当于化学中的熵，我记得高中化学说过，熵是描述分子（是的吧？）有序程度的量。熵越大，越无序。这里的信息熵类似，熵越大，则表示信息越无序，这里，我盗用一下别人举的例子：一个事件或一个系统，准确的说是一个随机变量，它有着一定的不确定性。

AI3 决策树的生成与训练-信息熵的计算

kling_bling的博客

08-16

570

决策树是非常经典的机器学习模型，以决策树为基模型的集成学习模型（XGBoost、GBDT 等）在工业界得到了极为广泛的应用。计算某一特征的信息增益主要分为两步，第一步是计算数据集的信息熵，信息熵可以表示为，其中代表的是属于某一类的样本个数，D 是整个数据集的样本数量，K 为类别数量。要求实现 calcInfoEnt 功能，数据集从当前路径下 dataSet.csv读取，计算在给定数据集的情况下，数据集的信息熵，信息熵用 infoEnt 进行表示，数据类型为 float，将 infoEnt 作为函数返回值。.

《机器学习实战》读书笔记3：信息熵和信息增益

请叫我AXin

02-06

2900

点进来的读者肯定都看过《机器学习实战》第三章-决策树，所以就不罗嗦啦。上一篇文章实在是太罗嗦了。：）信息熵(或香浓熵): Entropy首先举个例子：假如美国参众两院要弹劾川普，通过提前走访调查议员的想法，得出结果有80%的可能性川普被弹劾，20%的可能性川普不被弹劾。那么我们知道了川普很可能会被弹劾。好了，我们待会儿再来说川普。现在给出信息的计算公式： info(xi)=−log2p(xi)i

机器学习决策树算法中特征选项的算法实现——信息熵

12-22

机器学习决策树算法中特征选项的算法实现——信息熵 首先我们将信息熵的定义进行阐述: 熵经验熵我们这里以网上数据贷款申请为例:数据来自（https://blog.csdn.net/c406495762/article/details/75663451）在...

机器学习——决策树思维导图

11-26

机器学习——决策树思维导图决策树是一种常用的机器学习算法，它能够对复杂的数据进行分类和预测。决策树思维导图是指通过将决策树的结构和流程可视化，以便更好地理解和应用决策树算法。决策树的基本流程可以...

机器学习之算法决策树（分类）——通过例子说明信息熵的计算方法

PY_smallH的博客

12-11

5770

决策树采用的是信息熵或者Gini系数来作为分类标准。 信息熵公式： Gini系数公式：一般构造一个分类器(sklearn.tree.DecisionTreeClassifier)，默认参数criterion有{“gini”, “entropy”}, 其中default=”gini”。这两个计算公式不一样而已。我在这里计算的是信息熵的公式，另外的一个也都一样，换一个公式而已。我们在提到概率问题的时候都会有一个前提假设，假设这些变量或者特征都是相互之间没有关系的，就不会存在组合的情况，不然就没办法计算概率

从零开始的机器学习——ID3决策树（2018-6-23）.zip

最新发布

04-25

这个压缩包文件"从零开始的机器学习——ID3决策树（2018-6-23）.zip"可能包含了关于ID3决策树的基础知识、实现步骤、优缺点以及实际应用等内容。让我们深入探讨一下ID3决策树的核心概念。决策树是一种基于树状...

机器学习--信息 信息熵 信息增益

weixin_34152820的博客

12-10

323

信息：信息这个概念的理解更应该把他认为是一用名称，就比如‘鸡‘(加引号意思是说这个是名称)是用来修饰鸡(没加引号是说存在的动物即鸡)，‘狗’是用来修饰狗的，但是假如在鸡还未被命名为'鸡'的时候，鸡被命名为‘狗’，狗未被命名为‘狗’的时候，狗被命名为'鸡'，那么现在我们看到狗就会称其为‘鸡’，见到鸡的话会称其为‘鸡’，同理，信息应该是对一个抽象事物的命名，无论用不用‘信息’来命名这种抽象事物...

机器学习方法——通过实例简单推导信息熵

时生的博客

09-20

1635

今天在机器学习中碰巧接触到了信息熵这个词汇，搜索之后发现网上的描述都过于晦涩难懂，所幸在观看了几个相关视频后还算是有所理解，现在我来用不那么“机器学习”的大白话来记录一下信息熵到底是什么。

信息熵

qq_45402214的博客

06-07

418

熵(entropy,也称信息熵)用来度量一个属性的信息量。假定S为训练集，S的目标属性C具有m个可能的类标号值，C={C1,C2,…,Cm}，假定训练集S中，Ci在所有样本中出现的频率为pi (i=1,2,3,…,m)，则该训练集S所包含的信息熵定义为：熵越小表示样本对目标属性的分布越纯，反之熵越大表示样本对目标属性分布越混乱。 ...

机器学习笔记-信息熵

迷路剑客个人博客

10-16

572

0x01 摘要本文简单介绍 信息熵、条件熵、信息增益、交叉熵等熵相关的基础概念。 0x02 熵 2.1 信息量信息的大小跟随机事件的概率有关：越小概率的事情发生了产生的信息量越大（目睹飞碟）；越大概率的事情发生了产生的信息量越小（太阳东升西落）。因此一个具体事件的信息量应该是随着其发生概率而递减的，且不能为负。 2.2 信息熵 而信息熵则是在结果出来之前对可能产生的信息量的期望——信息熵是考虑...

【机器学习】熵（信息熵，联合熵，交叉熵，互信息）

CWS_chen

01-12

2425

机器学习中的各种熵，什么是熵？什么是交叉熵？什么是联合熵？什么是条件熵？什么是相对熵？它们的联系与区别是什么？前言：你必须知道的信息论 1948年，数学家和电气工程师克劳德香农（Claude Elwood Shannon）在其开创性论文《通信的数学理论》中提出了“信息论”，这一概念。对深度学习和人工智能的发展具有非凡的意义。那么，对于信息论大家又了解多少呢？在本文中，Abhis...

【机器学习】信息熵与数据分布的距离度量方法

Mr_health的博客

07-27

3492

机器学习中，绕不开的一个概念就是熵 (Entropy)，信息熵。信息熵常被用来作为一个系统的信息含量的量化指标，从而可以进一步用来作为系统方程优化的目标或者参数选择的判据。在决策树的生成过程中，就使用了熵来作为样本最优属性划分的判据。下面按照本人的理解来系统梳理一下有关熵的概念。 1 信息量信息量即信息多少的度量。公式表达如下：即如果事件概率越大，该携带的信息量越小；事件概率越小，该...

机器学习-9（信息熵的简单介绍）

neo的博客

11-12

510

这一节介绍一下信息熵，这个跟热力学的熵是有区别的，所以现在让我们忘记热力学第二定律，我们不需要去联想。在这里我将按0基础的思维来讨论信息熵到底是什么我们先把基础公式摘出来 H(X)=−∑xεXP(x)logP(x)) 看公式，我们已经能感受到了，这是离散型的，每个特征值是独立的。在计算机里面，我们就以0,1来表示是，否。这将牵扯到后面的决策树算法的介绍，每一次yes和no的回答都是为了把数据...

决策树，信息熵，信息增益计算----机器学习