一个完整决策树的构建案例

xzwyb---

已于 2023-08-10 10:17:16 修改

阅读量446

点赞数

分类专栏： Python基础语言机器学习文章标签：决策树 python

于 2022-11-02 11:31:22 首次发布

本文链接：https://blog.csdn.net/weixin_51347879/article/details/127648600

版权

决策树常用判定方式和构建决策树步骤

摘要由CSDN通过智能技术生成

"""
    数据样本展示：
        #x1,x2,x3, Y
        是,单身,125,否
        否,已婚,100,否
        否,单身,100,否
        是,已婚,110,否
        是,离婚,60,否
        否,离婚,95,是
        否,单身,85,是
        否,已婚,75,否
        否,单身,90,是
        是,离婚,220,否
"""

import numpy as np
import pandas as pd

def entropy(p):
    """
    信息熵的计算公式
    :param p:
    :return:
    """
    return np.sum([-t * np.log2(t) for t in p])

def gini(p):
    """
    Gini系数的计算公式
    :param p:
    :return:
    """
    return 1-np.sum([t * t for t in p])

def error(p):
    """
    错误率de公式
    :param p:
    :return:
    """
    return 1-np.max(p)

def h(p):
    """
    决策树中对节点纯度的衡量
    :param p:
    :return:
    """
    return entropy(p)
    # return gini(p)
    # return error(p)

"""
  找分割点，若先计算x3的信息增益;x3的概率占比:要设置分届阈值，因为它是连续特征
  以年收入97.5作为x3的划分值
"""
# 第一步&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xzwyb---

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一个完整决策树的构建案例

决策树常用判定方式和构建决策树步骤
复制链接

扫一扫

专栏目录

两个决策树例题经典案例-代码示例

baidu_38876334的博客

04-10

2657

在这个案例中，你的数据集可能包含以下特征：顾客的年龄、性别、职业、收入、是否有孩子、是否有车、是否常来餐厅、最近一次来餐厅的时间、是否投诉等。在这个示例中，我们使用类似于餐厅顾客流失预测的代码框架，首先加载数据集，然后选择特征和目标变量。最后，我们使用测试集来评估模型的性能，并打印出模型的准确率。在这个案例中，你的数据集可能包含以下特征：温度、湿度、气压、风速、风向等。你的目标是使用这些特征来预测天气类型，例如晴天、多云、雨天等。最后，我们使用测试集来评估模型的性能，并打印出模型的准确率。

决策树模型及案例（Python）

qq_42433311的博客

04-14

8万+

目录 1 决策树模型简介 2 Gini系数（CART决策树） 3信息熵、信息增益 4决策树模型代码实现 4.1分类决策树模型(DecisionTreeClassifier) 4.2回归决策树模型(DecisionTreeRegressor) 5案例：员工离职预测模型 5.1模型搭建 5.1.1数据读取与预处理 5.1.2提取特征变量和目标变量 5.1.3划分训练集与测试集 5.1.4模型搭建及训练 5.1.5代码汇总 5.2模型预测及评估 5.2.1直...

参与评论您还未登录，请先登录后发表或查看评论

决策树案例分析

m0_37228052的博客

09-18

582

决策树(Decision Tree)常用于研究类别归属和预测关系的模型，比如是否抽烟、是否喝酒、年龄、体重等4项个人特征可能会影响到‘是否患癌症’，上述4项个人特征称作‘特征’，也即自变量（影响因素X），‘是否患癌症’称为‘标签’，也即因变量（被影响项Y）。

sklearn机器学习：决策树案例

oax_knud的博客

11-28

1425

决策树是一种用来 classification （分类）和 regression（回归）的无参监督学习方法。其目的是创建一种模型从数据特征中学习简单的决策规则来预测一个目标变量的值。

【机器学习】Decision Tree 决策树算法详解 + Python代码实战

知不足而奋进，望远山而前行

10-11

4万+

节点在分割之前必须具有的最小样本数：叶子节点必须具有的最小样本数：叶子节点的最大数量：在每个节点处评估用于拆分的最大特征数（除非特征非常多，否则不建议限制最大特征数）max_depth：树最大的深度。

决策树算法原理+例题练习

qq_43436296的博客

07-25

2万+

决策树算法原理+例题练习

决策树案例_决策树_决策树案例_

09-29

案例中的“决策树案例.ipynb”文件很可能是一个Jupyter Notebook，里面包含了具体的Python代码示例，使用如scikit-learn这样的库实现决策树模型。你可以通过加载数据集、预处理数据、训练模型、可视化决策树结构以及...

决策树小案例.zip

热门推荐

程松

03-26

9万+

决策数(Decision Tree)在机器学习中也是比较常见的一种算法，属于监督学习中的一种。看字面意思应该也比较容易理解，相比其他算法比如支持向量机(SVM)或神经网络，似乎决策树感觉“亲切”许多。优点：计算复杂度不高，输出结果易于理解，对中间值的缺失值不敏感，可以处理不相关特征数据。缺点：可能会产生过度匹配的问题。使用数据类型：数值型和标称型。简单介绍完毕，让我们来通过一个例子让决策树“

根据信息增益率构造决策树_决策树--信息增益，信息增益比，Geni指数

weixin_42518981的博客

01-09

2161

决策树 是表示基于特征对实例进行分类的树形结构从给定的训练数据集中，依据特征选择的准则，递归的选择最优划分特征，并根据此特征将训练数据进行分割，使得各子数据集有一个最好的分类的过程。决策树算法3要素：特征选择决策树生成决策树剪枝部分理解：关于决策树生成决策树的生成过程就是使用满足划分准则的特征不断的将数据集划分为纯度更高，不确定性更小的子集的过程。对于当前数据集D的每一次的划分，都希...

根据信息增益率构造决策树_一文帮你搞懂何为信息增益——决策树必备

weixin_35078004的博客

02-01

1440

一、何为决策树决策树是监督学习算法之一，并且是一种基本的分类与回归方法；决策树也分为回归树和分类树，本文讨论的是分类树。如果了解或者学过数据结构，肯定对"树"这个概念是不陌生的，在此基础上学习掌握决策树也会更加容易，下面通过一个小例子帮助理解何为决策树。下图所示流程图即为一个决策树，矩形代表判断模块、椭圆形则代表终止模块，表示已经得出结论可以终止程序的运行；左右箭头表示分支，可以通过它到达另一判断...

根据信息增益率构造决策树_机器学习实战：决策树（一）信息增益

weixin_34725044的博客

02-01

1733

CSDN：https://blog.csdn.net/weixin_45814668微信公众号：qiongjian0427Git：https://github.com/qiongjian/Machine-learning/github.com运行环境：anaconda—jupyter notebookPython版本：Python31. 简介 k-近邻算法最大的缺点就是无法给出数据的内在含义，决...

机器学习——决策树的创建

Gucciwei的博客

11-17

3894

简单来说决策树就是一棵树，一颗决策树包含一个根节点、若干个内部结点和若干个叶结点，叶结点就是问题的决策结果。也就是说一棵树包括根节点、父节点、子节点、叶子节点。子节点由父节点分裂出来，然后子节点作为新的父节点继续分裂，直到得出最终结果。优点：易于理解和解释，决策树分类很快，可以处理不相关特征数据。缺点：对缺失数据的数据集处理困难。它构建过程是一个递归的过程，需要确定停止条件，否则过程将不会结束。很容易出现过拟合问题。

决策树算法

Wprofessor的博客

02-16

1193

决策树算法 决策树是一种基本的分类回归方法。在分类问题中，表示基于特征对实例进行分类的过程。 决策树的学习一般包括3个步骤：特征选择； 决策树的生成； 决策树的修剪。特征的选择：特征的选择一般准则为信息增益(ID3)，信息增益比(C4.5)和基尼指数(CART)。本文重点介绍信息增益算法。计算信息增益一般分为3个步骤： (1): 计算数据集D的熵H(D) k指的是数据集的...

【数据分析】决策树案例详解

技术无止境

06-20

3万+

文章来源：公众号-智能化IT系统。初识决策树决策树是一个类似于人们决策过程的树结构，从根节点开始，每个分枝代表一个新的决策事件，会生成两个或多个分枝，每个叶子代表一个最终判定所属的类别。例如，如下是一个决策树，代表薪水大于30W的男性会买车。我们可以很容易的写出IF Else来实现决策树的判定。上述的决策树有两个特征区间，性别和年龄，最终的结果有两个类别，买和不买。决策树流程我们在实际的大数据分析...

决策树原理实例(python代码实现)_决策树原理实例（python代码实现）

weixin_42355999的博客

02-05

712

利用python的C4.5算法写一个决策树的案例

04-22

关于你的问题，你可以按照以下步骤利用Python的C4.5算法编写一个决策树案例。步骤1：收集和准备数据集首先，你需要收集和准备一个数据集，然后将其转换为决策树可以理解的格式。例如，你可以使用pandas数据分析...

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交