决策树demo（python）

最新推荐文章于 2024-07-11 09:58:56 发布

妄念驱动

最新推荐文章于 2024-07-11 09:58:56 发布

阅读量1.1k

点赞数

分类专栏：机器学习算法文章标签：机器学习决策树算法 python

本文链接：https://blog.csdn.net/hx2017/article/details/77964267

版权

这篇博客详细介绍了决策树算法在Python中的应用，包括数据集的维度、模型参数如criterion、splitter、max_features等的解释，并探讨了如何通过调整参数如max_depth、min_samples_split来防止过拟合。同时，提到了class_weight参数在处理类别不平衡数据时的重要性，以及通过交叉验证确定最优的min_samples_split和n_estimators。

摘要由CSDN通过智能技术生成

%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd

from sklearn.datasets.california_housing import fetch_california_housing
housing = fetch_california_housing()
print(housing.DESCR)

这里写图片描述

housing.data.shape

(20640, 8)

housing.data[0]

array([ 8.3252 , 41. , 6.98412698, 1.02380952,
322. , 2.55555556, 37.88 , -122.23 ])

from sklearn import tree
# 一般主要设置这两个参数
dtr = tree.DecisionTreeRegressor(max_depth = 2)
dtr.fit(housing.data[:, [6, 7]], housing.target)

Decis

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

妄念驱动

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【python代码实现】决策树分类算法

weixin_47974364的博客

04-11

1万+

目录模拟数据决策树分类算法构建数据集绘制决策树代码模拟数据编号年龄收入范围工作性质信用评级购买决策 01 <30 高不稳定较差否 02 <30 高不稳定好否 03 30-40 高不稳定较差是 04 >40 中等不稳定较差是 05 >40 低稳定较差是 06 >40 低稳定好否 07 30-40 低稳定好是 08 <30 中等不稳定较差否 09 <30 低稳

决策树（DecisionTree）项目（python代码实现）

10-08

本压缩包包含： 1.本决策树（DecisionTree）项目python源代码文件； 2.项目用的数据（csv格式）； 3.一个普通文件，记录本项目的调试过程，用作实战参考

参与评论您还未登录，请先登录后发表或查看评论

决策树的Python实现demo(一天一个小demo!)

sinat_26566137的博客

05-22

650

#!/usr/bin/env python # -*- coding: utf-8 -*- # @createTime : 18-5-22 下午4:44 # @author : nn import numpy as np import math data=[[0,1,0],[1,0,0],[0,1,0],[1,1,1]] print(type(data)) data = np.array...

【Python】决策树算法详解版【附完整版示例】

最新发布

Young_Pro的博客

07-11

1931

在上面的代码中，我们已经训练了决策树模型，并进行了交叉验证和预测。接下来，我们将展示如何导出决策树的可视化图形，以及如何评估模型性能。在这段代码中，我们计算了混淆矩阵以及精确率、召回率和F1分数，这些都是评估分类模型性能的重要指标。工具将其转换为PNG格式的图片，这样就可以直观地看到决策树的结构。在这个例子中，我们使用Pandas读取数据，然后使用Scikit-learn的。通过这些步骤，可以比较全面地理解决策树算法的工作原理，并能够使用。在上面的代码中，我们使用了。进行模型的训练和预测。

决策树如何寻找最优参数

vimpirespider的博客

09-27

1239

from sklearn.model_selection import StratifiedKFold #交叉验证 from sklearn.model_selection import GridSearchCV #网格搜索 pat= {'splitter':('best','random'), 'criterion':('gini','entropy'), 'max_depth':[*range(1,10)], ...

Python实例决策树

tutuliangliang的博客

08-20

446

根据某种海洋动物在不浮出水面的情况下是否可以生存、是否有脚蹼两种特征将其分为鱼类和非鱼类。 no surface flipper ffish 1 1 yes 1 1 yes 1 0 no 0 1 no 0 0 no 输入原始数据集计算原始数据集的Shannon熵输出数据集的熵 def creat...

Python决策树demo可视化

醉糊涂仙的博客

07-31

1523

基础环境： anaconda3-5.2.0 Python3.6 win10x64 一，win10安装graphviz-2.38.msi 官网下载：https://graphviz.gitlab.io/_pages/Download/Download_windows.html 网盘下载：https://pan.baidu.com/s/1acgCB8nFwxkryvKivCb1Pw ...

基于信息增益的决策树（python）

11-16

自己用Python3.6.1 写的基于信息增益的决策树，信息熵函数、信息增益函数、多数表决函数、产生决策树的函数写的都比较清楚，直接下载放在python环境中就能出结果，数据用的是周志华老师的《机器学习》的表4.3。

python实现决策树算法并绘图

算法笨蛋

01-30

2786

本文不涉及决策树算法的原理，只通过python代码实现算法，并且没有用到机器学习库，根据算法流程一步一步实现。 决策树 本文使用ID3算法实现决策树。计算熵首先是计算香农熵，需要了解计算公式 # 计算数据集的香农熵 def ent(data): num = len(data) # 数据的数量 count = {} # 计算标签数量 for d in data: label = d[-1] # 获得数据标签 if label not i

python-sklearn数据分析-决策树（CART）分类（实战）

weixin_57501965的博客

08-30

3448

可以看到，该文件大小为61878*95，其中最后一列为目标标签；其中还发现该文件数据没有缺失值和重复值。最后一列是object类型，这里采用字典编码进行转换。相关可视化效果展示如下。

决策树算法及参数说明

09-17

Microsoft 决策树算法支持多个参数，这些参数会对所生成的挖掘模型的性能和准确性产生影响。下表对各参数进行了说明。

python选择最佳决策树参数

weixin_30947043的博客

07-25

510

# -*- coding: utf-8 -*- #导入数据 import pandas as pd data = pd.read_csv(r'E:\Python\machine learning\own\decision_tree\test.csv') X = data.ix[:,0:4].values y = data.ix[:,4].values #设置待选的参数 ...

决策树3: 特征选择之寻找最优划分

木东居士

12-15

2610

0x00 前言 决策树算法的三个步骤：特征选择、决策树生成、决策树剪枝。其中特征选择要解决的核心问题就是：每个节点在哪个维度上做划分？某个维度在哪个值上做划分？划分的依据是：要让数据划...

决策树（CLS, ID3, CART, 随机森林, 参数详解），一篇就够了

weixin_42587163的博客

04-02

4596

决策树总结及笔记概况与基本概念概况CLS算法ID3算法(熵，信息增益)ID3 决策树生成概况与基本概念概况原则：判断的越快越好，决策树尽量不要太深，保证好的泛化能力，同时又保证训练集上准确率；特点：可读性，分类速度快；可表示为IfThen形式；可认为定义在特征空间与类空间上条件概率分布；过程依赖于属性变量取值特点；可自动判断属性变量重要性，忽略不重要属性变量；主要算法：CLS, ...

决策树中使用网格搜索寻找最优参数

CSDN_Arice的博客

03-25

8947

决策树 决策树是一个树结构（二叉树或非二叉树），其每个非叶节点表示一个特征上的测试，每个分支代表这个特征在某个值域上的输出，每个叶节点存放一个类别。使用决策树进行决策的过程就是从损节点开始，观试待分类项中相应的特征，并按照其值选择输出分支，直到到达叶子节点，然后将叶子节点存放的类别作为决策结果。 决策树模型通过对训练样本的学习，建立分类规则，然后依据分类规则，对新样本数据进行分类预测。决策树是最经常使用的数据挖掘算法，它主要的优点有; 1.易于理解和实现。不需要使用者了解很多的背景知识，其通过决策树就能够直

DecisionTree决策树参数详解

Amanda_python的博客

12-22

4489

1.max_depth: 指定遍历搜索的最大深度。int or None, optional (default=None) 一般来说，数据少或者特征少的时候可以不管这个值。如果模型样本量多，特征也多的情况下，推荐限制这个最大深度，具体的取值取决于数据的分布。常用的可以取值10-100之间。常用来解决过拟合 2.min_sample_leaf: 叶子节点最少样本数。这个值限制叶子节点最少的样本数，若叶子节点数小于样本数，则会和兄弟节点一起被剪枝，样本量不大时，可不管这个值 3.max_leaf_nodes

决策树（decision tree）(一)——构造决策树方法