Sklearn学习笔记

开发环境: Anacoda-jupyter 下载graphviz 一、sklearn的基本信息 官网:https://scikit-learn.org/stable/ 推荐书籍:《数据挖掘导论》《机器学习》又称西瓜书 sklearn分为六个板块,如下: 分类 回归 聚类 降维 模型选择 数据的预处理 二、决策树学习重点: 解决两个重要问题: 如何从数据表中找出最佳节点和最佳分支?
摘要由CSDN通过智能技术生成

开发环境:

  • Anacoda-jupyter

  • 下载graphviz

一、sklearn的基本信息

  • 官网:https://scikit-learn.org/stable/

  • 推荐书籍:《数据挖掘导论》《机器学习》又称西瓜书

  • sklearn分为六个板块,如下:

  1. 分类

  2. 回归

  3. 聚类

  4. 降维

  5. 模型选择

  6. 数据的预处理

二、决策树

学习重点:

  1. 解决两个重要问题:

  • 如何从数据表中找出最佳节点和最佳分支?

  • 如何让决策树停止生长,防止过拟合?

  1. 掌握8个参数,1个属性,4个接口

2.1 基本定义

  • 同时被用于分类和回归问题;

  • 最大的缺点就是非常容易过拟合( 什么是过拟合?就是说,它会在训练集上表现很好,在测试集上却表现糟糕。);

  • 从一张有特征和标签的表格中,通过对特征进行提问,为我们总结出一系列决策规则,并用树状图来呈现这些决策规则。

  • 是非参数有监督的学习方法;

  • 在决策过程中,我们一直在对记录的特征进行提问,那么:

  • 最初问题所在的地方叫做根节点(没有进边,只有出边);

  • 在得到结论前的每一个问题都是中间节点(有进边,也有出边);

  • 得到的每一个结论都叫做叶子节点(有进边,没有出边);

Tips:在两个相连的节点中,更接近根节点的是父节点,另一个是子节点。

2.2 决策树包含五个类

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值