【自用】菜菜sklearn 第一期 决策树概述 & 分类树

决策树

1.1 概述

1 Decision Tree 非参数的有监督学习方法;树状图;解决分类和回归问题;

        

         根节点;中间节点;叶节点;子节点和父节点

2 决策树算法的核心是要解决两个问题:

        1)如何从数据表中找出最佳节点和最佳分支

        2)如何让决策树停止生长,防止过拟合

1.2 sklearn中的决策树

tree.DecisionTreeClassifier 分类树
tree.DecisionTreeRegressor 回归树
tree.export_graphviz 将生成的决策树导出为DOT格式,画图专用
tree.ExtraTreeClassifier 高随机版本的分类树
tree.ExtraTreeRegressor 高随机版本的回归树

sklearn的基本建模流程

        

 在这个流程下,分类树对应的代码:

# 导入需要的模块
from sklearn import tree

# 实例化
clf = tree.DecisionTreeClassifier()
# 用训练集数据训练模型
clf = clf.fit(x_train, y_train)
# 导入测试集,从接口中调用需要的信息
result = clf.score(x_test, y_test)

2 DecisionTreeClassifier与红酒数据集

class sklearn.tree.DecisionTreeClassifier(criterion='gini', )

2.1 重要参数

2.1.1 criterion

对分类树来说,衡量决策树最佳节点和最佳分支的指标叫“不纯度”;不纯度越低,决策树对训练集的拟合越好;现在使用的决策树算法在分支方法上围绕着不纯度相关指标的最优化

criterion这个参数正是用来决定不纯度的计算方法的

sklearn提供了两种选择:

        1) 输入'entropy'&

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值