机器学习入门教学——决策树

恣睢s

已于 2023-09-09 14:46:01 修改

阅读量810

点赞数

分类专栏：机器学习文章标签：机器学习决策树人工智能

于 2023-09-09 10:26:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45100742/article/details/132772984

版权

机器学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

1、简介

决策树算法是一种归纳分类算法，它通过对训练集的学习，挖掘出有用的规则，用于对新数据进行预测。
决策树算法属于监督学习方法。
决策树归纳的基本算法是贪心算法，自顶向下来构建决策树。
- 贪心算法：在每一步选择中都采取在当前状态下最好/优的选择。
简单来说，决策树就是做决策的树，类似于流程图的结构，其中每个内部节点代表一个属性上的“判断”，每个分支代表测试的结果，每个叶节点代表一个测试结果，从根到叶的路径代表分类规则。
决策树的结构：

2、原理

决策树希望通过每次分支节点的“决策”使结果变得更纯粹。也就是通过层层筛选，让是否批准分成“批准”和“拒绝”的单一子集。
举个简单的例子：
- 使用模型快速判断银行是否给客户放贷。数据经过下列分类之后，最终只剩下单一的子集。
- 模型需要学习哪些特征和相应的正确阈值才能最好地分割数据，即有工作、有房子、信誉，应该选择哪些，应该选择何值。所以，在决策树的生成过程中，分割方法即属性选择的度量是关键。

2.1、基尼系数

基尼系数(Gini Index)是决策树学习中常用的一种划分评价指标。
基尼系数计算公式：（一减去所有类别概率的平方）
上述二分分类问题中，公式为：
含义：基尼系数衡量了一个数据集合的不确定性。
例如：
- （基尼系数随概率的变化）
在决策树中，基尼系数最小意味着分割后子集合的纯度最高。所以，选择基尼系数最小的属性，来作为决策树下一级分类的标准即可。

2.2、生成过程

计算公式：

2.2.1、选择第一个分类标准

首先根据贷款结果计算基尼系数。
- 可以看出这个基尼系数非常大。
再以有无工作来计算基尼系数。
- 计算以工作为分类标准的基尼系数需要通过加权的方式求和得到该标准最终的基尼系数。
以此类推，可以计算出以房子和信誉为分类标准的基尼系数。
其中，以房子为分类标准的基尼系数最小，所以选择它为标准来构建决策树。

2.2.2、选择下一个分类标准

根据上述分类，左边已经是一个单一子集，不需要再进行分类。我们对右边的子集进行分类。
首先根据贷款结果计算基尼系数。
再计算出以工作和信誉为分类标准的基尼系数（只在没有房子的客户中）。
其中，以工作为分类标准的基尼系数最小，所以选择它为标准来构建决策树。
此时，所有的叶节点都是单一子集，分类完成。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习入门教学——决策树

决策树的简单概述。
复制链接

扫一扫

专栏目录

恣睢s CSDN认证博客专家 CSDN认证企业博客

码龄5年

197: 原创

5941: 周排名

8008: 总排名

23万+: 访问

: 等级

3842: 积分

3381: 粉丝

1759: 获赞

43: 评论

2756: 收藏

私信

关注

热门文章

分类专栏

Python 26篇
网络协议 12篇
AIFuzz 28篇
Linux 2篇
WSL 4篇
LLVM 5篇
协议模糊测试 2篇
Latex 2篇
人工智能 4篇
工具使用 4篇
机器学习 14篇
网络安全 14篇
计算机基础知识 16篇
深度学习 13篇
数据库 6篇
服务器 1篇
逆向 7篇
C/C++ 2篇
测试 1篇
vue 7篇
算法 2篇
PyTorch 11篇
应用技巧 2篇
联邦学习 1篇
嵌入式 5篇
STM32 2篇
JavaScript 1篇
css 1篇

最新评论

机器学习入门教学——梯度下降、梯度上升
龙飞冲天！: 写的很生动，受教了
WSL——卸载、安装CUDA
一纸战荒年: sudo ./cuda-uninstaller没有这个
RTSP协议——Live555安装（Linux）
zhwhmx: 请问大佬，为什么要使用ffmpeg连接虚拟机测试呢?为啥不直接在live555所在目录放视频文件，直接拉取rtsp来验证？
AFLNet入门教学——安装（Ubuntu22.04.4）
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
网络协议——FTP（简介、搭建FTP服务端）
征途黯然.: This 网络协议FTP简介搭建FTP服务端 article is truly great and very insightful.

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

恣睢s 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。