机器学习-决策树算法

最新推荐文章于 2024-04-23 09:46:42 发布

帅泽泽

最新推荐文章于 2024-04-23 09:46:42 发布

阅读量781

点赞数 2

分类专栏：学习笔记机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44633951/article/details/109369576

版权

1. 学习目标

掌握决策树实现过程
知道信息熵的公式以及作用
知道信息增益的作用
知道信息增益率的作用
知道基尼指数则作用
知道id3,c4.5，cart算法的区别
了解cart剪枝的作用
应用DecisionTreeClassifier实现决策树分类

2. 决策树算法简介

决策树：是一种树形结构，其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果，本质是一颗由多个判断节点组成的树（决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-else结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法）

3. 决策树分类原理

3.1 熵

物理学上，熵 Entropy 是“混乱”程度的量度。

在这里插入图片描述
系统越有序，熵值越低；系统越混乱或者分散，熵值越高。

信息理论：
1、从信息的完整性上进行的描述:

当系统的有序状态一致时*数据越集中的地方熵值越小，数据越分散的地方熵值越大。

2、从信息的有序性上进行的描述:

当数据量一致时，系统越有序，熵值越低；系统越混乱或者分散，熵值越高。

信息熵（Entropy）的概念：

假如事件A的分类划分是（A1,A2,…,An），每部分发生的概率是(p1,p2,…,pn)，那信息熵定义为公式如下：（log是以2为底，lg是以10为底）

在这里插入图片描述

3.2 决策树的划分依据一------信息增益

3.2.1概念

信息增益：以某特征划分数据集前后的熵的差值。熵可以表示样本集合的不确定性，熵越大，样本的不确定性就越大。

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习-决策树算法

1. 学习目标掌握决策树实现过程知道信息熵的公式以及作用知道信息增益的作用知道信息增益率的作用知道基尼指数则作用知道id3,c4.5，cart算法的区别了解cart剪枝的作用应用DecisionTreeClassifier实现决策树分类2. 决策树算法简介决策树：是一种树形结构，其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果，本质是一颗由多个判断节点组成的树（决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-else结构
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。