第23步机器学习分类实战：决策树（DT）建模

Jet4505

已于 2023-06-07 11:33:10 修改

阅读量803

点赞数 2

分类专栏：《100 Steps to Get ML》—JET学习笔记文章标签：机器学习决策树分类

于 2023-02-19 22:53:44 首次发布

本文链接：https://blog.csdn.net/qq_30452897/article/details/129116103

版权

《100 Steps to Get ML》—JET学习笔记专栏收录该内容

103 篇文章 22 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

前言
一、Python调参
二、SPSSPRO调参
总结

前言

假装有

一、Python调参

（1）建模前的准备

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
dataset = pd.read_csv('X disease code fs.csv')
X = dataset.iloc[:,<

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Jet4505

关注关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

第6步 决策树（DT）

qq_30452897的博客

02-15

732

搭建DT模型

Machine Learning-经典模型之DT Learning

Pysamlam的博客

04-17

543

本篇文章整理一下decision tree learning的知识点。下面是维基百科的定义：Decision tree learninguses adecision ...

3 条评论您还未登录，请先登录后发表或查看评论

机器学习（三） --- DT（Decision Tree）

williamgavin的博客

02-08

1881

文章目录Decision TreeIntroductionConstructing Decision TreesexamplePruning决策树、随机森林和Gradient BoostingReference： Decision Tree 本文并不是给零基础的人看的哈，看之前需要了解一下啥是决策树。 Introduction 决策树是一种根据给定数据集产生一系列规则组成一棵树的算法。一般来说，数据集中样本的特征包括两类：一类是数值属性，另一类是分类属性。在一棵决策树中：内部结点表示属性边表示一种

机器学习 笔记04 ---决策树(DT)：理论+代码实现

S1406793的博客

10-31

3520

1、概述编辑 2、决策树模型 3、决策树学习 4、决策树的构建——三步骤 4.1 特征选择 4.1.1 熵（Entropy） 4.1.2 条件熵（Conditional Entropy）H(Y|X) 4.1.3 信息增益（Information Gain） 4.1.4 信息增益比 4.2决策树算法 4.2.1 ID3算法 4.2.2 C4.5算法 4.2.3 Python实现ID3、C4.5算法 4.3 决策树的剪枝引言 4.3.1 算法目的 4.3.2 算法

机器学习方法之决策树（Decision Tree，DT）

weixin_43694959的博客

08-22

1006

机器学习方法之决策树（Decision Tree，DT） 决策树是最常见的机器学习方法之一，对该方法的原理，前人之述备矣，在这里不再详细介绍。本文主要是对决策树的一些重要的概念及其应用进行讲述。 1、举个栗子 决策树是什么呢？我们先通过一个例子来看看，下面是一段情景对话：母亲：女儿，你也不小了，还没对象！妈很揪心啊，这不托人给你找了个对象，明儿去见个面吧！女儿：年纪多大了？母亲：25 女儿：长的帅不帅？母亲：挺帅的！女儿：收入高不高？有没有上进心？母亲：收入还行，蛮有上进心！将上述过程用决策树

机器学习 — 决策树建模

lack的专栏

02-28

256

决策树 适合用来处理带有分界点的数据优点易于解释：能结合实际数据对受训模型进行合理的解释，便于理解可以同时接受分类数据和数值数据作为输入允许数据缺失缺点过度拟合：专门针对训练数据创建出来的分支，可能更具有特殊性。解决办法：对决策树进行剪枝针对不同类型的数据集使用不同的分类算法，针对数字的、针对字符串的数据量大的时候，效率较低只能创建大于或者小于，不能处理复杂关系的数据 i

机器学习实战笔记(2) 决策树(分类的方法）

rockla的博客

10-20

374

第一章节看的非常舒服，轻松就理解了k-紧邻算法和手写体识别的例子。结果第二章给我当头一棒，反复看就看不懂啊。完全不知道译者说的名词的意思！个人感觉译者（当然是作者限制的内容）没法形象的解释怎么个策略选择节点和生成分支。尤其是带划分数据集，划分数据集特征，需要返回特征等，都无法和实际的例子结合理解。头大之际，只好去搜索前人的学习笔记了。 https://

第24步 机器学习分类实战：随机森林（RF）建模

qq_30452897的博客

02-20

1962

随机森林（RF）建模

第26步 机器学习分类实战：Adaboost建模

qq_30452897的博客

02-21

783

Adaboost建模

dt公式模型包

06-02

dt的各位的模型miku，rin，len，luka，haku，neru，gumi，neiko，meiko，ca，teto

8_DT_决策树算法.zip

12-10

决策树是一种广泛应用于数据分析和机器学习的算法，它通过创建代表不同特征的树状模型来进行预测。在本资源"8_DT_决策树算法.zip"中，我们能够学习到如何使用Python的numpy库来实现自编的决策树算法。numpy是Python...

3.1 机器学习 --- 决策树

woaixuexi6666的博客

11-07

1906

无

机器学习算法_DT_决策树模型案例1_基于sklearn接口的分类

佐少的博客

04-20

494

机器学习算法_DT_决策树模型案例1_基于sklearn接口的分类1、导入功能模块函数2、建模2.1、导入测试数据数据集2.2、划分测试集-训练集-验证集2.3、模型训练，测试调参，外延测试2.3.1、设置模型参数2.3.2、模型训练3、模型预测与评估3.1、模型预测3.2、模型评估 1、导入功能模块函数 ‘’'python from sklearn import datasets ...

机器学习实战：Python基于DT决策树模型进行分类预测（六）

Senoh的博客

04-20

1738

决策树（Decision Tree，DT）是一种类似流程图的树形结构，其中内部节点表示特征或属性，分支表示决策规则，每个叶节点表示结果。在决策树中，最上方的节点称为根节点。它学习基于属性值进行分区。它以递归方式进行分区，称为递归分区。这种类似流程图的结构有助于决策制定。它的可视化类似于流程图，可以很容易地模拟人类的思维过程。这就是为什么决策树易于理解和解释的原因。决策树的时间复杂度是给定数据中记录和属性数量的函数。决策树是一种无分布或非参数方法，不依赖于概率分布假设。决策树可以很好地处理高维数据。

【算法】一个简单的决策树（DT）原理

YaoYee_21的博客

08-02

662

决策树的构建过程就是确定特征的顺序和对应的决策规则。

PYTHON机器学习实战——决策树ＤＴ

万有文的博客

08-05

957

决策树也是有监督机器学习方法。 决策树算法是找到一个优化的决策路径（决策树），使得每次分类尽可能过滤更多的数据，或者说问的问题尽量少。 决策树算法可以用来优化一些知识系统，帮助用户快速找到答案。基本概念属性(Feature): 训练数据中每列都是一个属性。标签(Label)：训练数据中的分类结果。如何构造决策树 这里，要解决的问题是采用哪些数据属性作为分类条件，最佳次

DT-数据结构实战开发

梦心之魂的博客

12-10

152

数据结构

《机器学习实战》学习（二）——决策树（DT）

不系之舟的专栏-QQ讨论群331590339

09-11

3085

1、决策树简述决策树学习是一种逼近离散值目标函数的方法，在这种方法中学习到的函数被表示为一棵决策树。在周志华老师的《机器学习》这本书中专门一章节对决策树进行了讲述。并对id3算法后的改进算法也做了相应的介绍。决策树容易导致过拟合现象，介绍了预剪枝和后剪枝等相关的处理方法。决策树依赖测试集，可以把测试集生成的树结构序列化存到文件中，下次使用可以很快进行加载。一个牛人对决策树的总结，我觉得很有道理，

机器学习入门级实例针对葡萄酒质量利用KNN、决策树、随机森林对数据进行建模的完整代码

最新发布

06-09

好的，以下是一个使用KNN、决策树、随机森林对葡萄酒质量数据进行建模的完整Python代码：首先，需要导入必要的库： ```python import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.neighbors import KNeighborsClassifier from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score ``` 接下来，读取数据并进行预处理： ```python # 读取数据集 data = pd.read_csv('winequality.csv') # 将数据集分为特征和目标 X = data.iloc[:, :-1].values y = data.iloc[:, -1].values # 将目标变量转换为二元变量 for i in range(len(y)): if y[i] < 6: y[i] = 0 else: y[i] = 1 # 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 特征缩放 sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) ``` 然后，使用KNN进行建模和预测： ```python # KNN分类器 knn = KNeighborsClassifier(n_neighbors=5) knn.fit(X_train, y_train) # 预测测试集结果 y_pred_knn = knn.predict(X_test) # 输出模型准确率 acc_knn = accuracy_score(y_test, y_pred_knn) print("KNN准确率：", acc_knn) ``` 接下来，使用决策树进行建模和预测： ```python # 决策树分类器 dt = DecisionTreeClassifier(criterion='entropy', random_state=0) dt.fit(X_train, y_train) # 预测测试集结果 y_pred_dt = dt.predict(X_test) # 输出模型准确率 acc_dt = accuracy_score(y_test, y_pred_dt) print("决策树准确率：", acc_dt) ``` 最后，使用随机森林进行建模和预测： ```python # 随机森林分类器 rf = RandomForestClassifier(n_estimators=10, criterion='entropy', random_state=0) rf.fit(X_train, y_train) # 预测测试集结果 y_pred_rf = rf.predict(X_test) # 输出模型准确率 acc_rf = accuracy_score(y_test, y_pred_rf) print("随机森林准确率：", acc_rf) ``` 完整代码如下： ```python import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.neighbors import KNeighborsClassifier from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score # 读取数据集 data = pd.read_csv('winequality.csv') # 将数据集分为特征和目标 X = data.iloc[:, :-1].values y = data.iloc[:, -1].values # 将目标变量转换为二元变量 for i in range(len(y)): if y[i] < 6: y[i] = 0 else: y[i] = 1 # 将数据集分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 特征缩放 sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) # KNN分类器 knn = KNeighborsClassifier(n_neighbors=5) knn.fit(X_train, y_train) # 预测测试集结果 y_pred_knn = knn.predict(X_test) # 输出模型准确率 acc_knn = accuracy_score(y_test, y_pred_knn) print("KNN准确率：", acc_knn) # 决策树分类器 dt = DecisionTreeClassifier(criterion='entropy', random_state=0) dt.fit(X_train, y_train) # 预测测试集结果 y_pred_dt = dt.predict(X_test) # 输出模型准确率 acc_dt = accuracy_score(y_test, y_pred_dt) print("决策树准确率：", acc_dt) # 随机森林分类器 rf = RandomForestClassifier(n_estimators=10, criterion='entropy', random_state=0) rf.fit(X_train, y_train) # 预测测试集结果 y_pred_rf = rf.predict(X_test) # 输出模型准确率 acc_rf = accuracy_score(y_test, y_pred_rf) print("随机森林准确率：", acc_rf) ```

第23步 机器学习分类实战：决策树（DT）建模

文章目录

前言

一、Python调参

第23步机器学习分类实战：决策树（DT）建模