《Python机器学习基础教程》学习笔记(6) 决策树

本文介绍了决策树的构造过程,包括通过信息增益寻找最佳划分特征,以及如何形成分类或回归模型。讨论了防止过拟合的预剪枝和后剪枝策略,并强调了决策树在可视化和特征重要性分析方面的优势。尽管决策树容易过拟合,但在集成学习中仍具有重要地位。
摘要由CSDN通过智能技术生成

决策树是广泛用于分类与回归的模型,表现形式是一棵二叉树,本质上是一系列的if/else问题。一棵决策树示例:

构造

①要构造一棵决策树,需要构造一系列的if/else问题,这些问题称为测试。算法搜遍所有可能的测试,找出对目标变量来说信息量最大的那一个(区分效果最好的),作为一个结点

②根据是否满足该结点的条件分为左右子结点,对当前数据进行划分

③反复递归,直到所有叶结点都只包含单一类别,称为纯的(pure)、

这很像一棵二叉搜索树(BST),只不过BST的结点询问的是“要搜索的值是否比该结点的值小/大?”,而决策树的结点询问的是“该样本是否满足条件xxx?”,然后根据问题的答案选择该结点的左/右子树。而不同之处在于,BST可能在树的中间就停下(找到目标值),而决策树会一直搜索至树的叶子结点

 

模型

决策树可用于分类与回归任务,分别通过sklearn.tree.DecisionTreeClassifier

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值