sklearn学习决策树算法

本文介绍了如何利用Python的sklearn库实现决策树算法。首先,数据集需要经过DictVectorizer转换为数值型数据。接着,可以使用DecisionTreeClassifier进行模型训练和测试。在生成的dot文件无法直观展示决策树结构时,可通过graphviz工具将其转化为PDF,以便查看整棵树的形态。在实际操作中,可能会遇到ValueError:期望2D数组,但得到的是1D数组的问题。
摘要由CSDN通过智能技术生成

python有一个非常棒的机器学习依赖包sklearn,用于实现机器学习的很多算法,本文将介绍用sklearn中的决策树的接口来实现决策树。

决策树是一种用于分类的算法,是一种监督学习算法,具体有id3、c4.5和cart三种算法组成。首先通过csv来导入数据集,注意csv格式是按照每一列以逗号为分隔符的形式。但是因为调用sklearn的包时,需要将数据集的表现格式进行转化,也就是通过也就是比如某一个特征取值为youth、middle_aged和senior,那么会通过转化方式将这三个特征变为如果取youth,那么该值取1,否则取0;如果取middle_aged,那么该值就取1,否则就取0,依次类推。这里sklearn就有一个DictVectorizer类转化工具,用于将一个数据集表示成只包含数值型数据的一个list,这样就可以应用相应的算法进行计算了。

然后就是调用sklearn中的决策树算法来实现,默认tree下关于决策树有两个可以调用的文件,即DecisionTreeClassifier 和 DecisionTreeRegressor两个包,一个用于分类,另一个用于回归。可以用训练集对其进行训练模型,然后用新的测试集对该模型进行测试,

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值