文章目录 随机森林分类器主要内容决策树的建立决策树建立实例 信息熵引例熵的解释 条件熵条件熵推导 联合熵与条件熵相对熵互信息互信息的物理意义 关于相对熵的解释利用熵做决策树决策树总结做决策树时--根据哪个特征做分类的依据一种无意义的特征做分类依据造成无意义划分的原因 Gini系数第一定义(机器学习定义)第二定义(经济学定义) 三种决策树学习算法 随机森林分类器 主要内容 决策树的建立 决策树建立实例 信息熵 引例 熵的解释 条件熵 条件熵推导 联合熵与条件熵 相对熵 互信息 互信息的物理意义 关于相对熵的解释 利用熵做决策树 决策树总结 做决策树时–根据哪个特征做分类的依据 一种无意义的特征做分类依据 造成无意义划分的原因 Gini系数 第一定义(机器学习定义) Gini第一定义:值最大代表贫富差距平均,最平均。0代表贫富差距最大,最不平均。 第二定义(经济学定义) Gini第二定义:0代表贫富差距平均,最平均。1代表贫富差距最大,最不平均。 三种决策树学习算法