gini系数决策树_Spark MLlib 决策树算法

最新推荐文章于 2024-06-24 18:02:39 发布

weixin_39621860

最新推荐文章于 2024-06-24 18:02:39 发布

阅读量358

点赞数

文章标签： gini系数决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39621860/article/details/111664952

版权

一、决策树简介

决策树是一个树结构，由节点和有向边组成。节点包括内部节点和叶子节点，内部节点表示一个特征或一个属性，叶子节点表示一个分类；有向边是对节点的属性判断。使用决策树进行决策的过程，就是从根节点，按照边上的条件判断，直到划分到叶子节点的分类。就像机器学习圣经《西瓜书》上，如何挑选一个好瓜一样的。那么问题来了，如何构建决策树呢？实际上就是如何选特征，对数据集进行不断的划分~

二、决策树理论

在当前节点使用哪个特征作为切分判定，取决于切分后节点数据集合中的类别纯度。切分后的数据越纯，那么当前切分就越合理。那么如何衡量类别的纯度呢？这里有3个指标。

1、熵（针对分类）

信息量：
信息熵：信息量的期望
信息增益：分类前，熵大；分类后，熵小；信息增益表达熵的变化。特征
对训练集

最低0.47元/天解锁文章

weixin_39621860

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
gini系数决策树_Spark MLlib 决策树算法

一、决策树简介决策树是一个树结构，由节点和有向边组成。节点包括内部节点和叶子节点，内部节点表示一个特征或一个属性，叶子节点表示一个分类；有向边是对节点的属性判断。使用决策树进行决策的过程，就是从根节点，按照边上的条件判断，直到划分到叶子节点的分类。就像机器学习圣经《西瓜书》上，如何挑选一个好瓜一样的。那么问题来了，如何构建决策树呢？实际上就是如何选特征，对数据集进行不断的划分~二、决策树理论在当前...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。