【Python机器学习】——决策树-sklearn

最新推荐文章于 2023-06-19 11:38:28 发布

小猪课堂

最新推荐文章于 2023-06-19 11:38:28 发布

阅读量433

点赞数

分类专栏： python机器学习阅读总结

本文链接：https://blog.csdn.net/qq_39885465/article/details/103165286

版权

本文总结了使用scikit-learn库构建决策树的过程，包括数据向量化、构造决策树模型和保存模型为DOT文件。通过DictVectorizer处理分类数据，LabelBinarizer进行标签二值化，然后利用DecisionTreeClassifier创建决策树，并展示了如何将DOT文件转化为PDF以可视化决策树结构。

摘要由CSDN通过智能技术生成

刘建平的文章：scikit-learn决策树算法类库使用小结

调用包

from sklearn.feature_extraction import DictVectorizer #feature_extraction 特征提取
#DictVetorizer 用于传入构造dummy_array,也可以使用pandas.get_dummies()来实现
import pandas as pd
import numpy as np
import csv#调用csv模块
from sklearn import tree#调用决策树模块
from sklearn import preprocessing#调用预处理模块

不明白就点（哪里不会点哪里）
DictVectorizer

1、导入数据

allElectronicsData=open(r'E:\个人\学习文档\决策树模板.csv','rt')#'r'/'rt'为文本模式
reader=csv.reader(allElectronicsData)#可以按行读取内容
headers=next(reader)#获取表头，也可以说是标题名称

next(reader)解释
在这里插入图片描述
2、数据向量化（将分类数据处理成dummy variable（后面的代码默认使用方法一的变量））
方法一：
sklearn包已经将一些计算逻辑写好，我们只需要将数据导入，但是我们需要对分类变量转换成虚拟变量的形式导入。需要对数据进行加工处理：

#建立两个列表
featureList=[]#featureList为特征（变量）列表；或者成为自变量（x）
labelList=[

最低0.47元/天解锁文章

小猪课堂

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【Python机器学习】——决策树-sklearn

调用包from sklearn.feature_extraction import DictVectorizerimport csvfrom sklearn import treefrom sklearn import preprocessing#预处理导入数据allElectronicsData=open(r'E:\个人\学习文档\决策树模板.csv','rt')#'r'/'rt...
复制链接

扫一扫

专栏目录