机器学习工具篇_sklearn_决策树

 

 

课程是全面讲解sklearn包官网的应用

2.决策树

Q:决策树是什么? 

非参数的有监督的学习方法。

主要用于解决分类和回归问题

把包含特征的列表,转成树状图的方式

Q:特别概念

 进边与出边的区别是,箭头指哪里

叶子节点是最末端,中间节点是中间。

Q:使用决策树需要解决的两个问题

根据数据表画出最好的树,同时控制树的高度

Q:sklearn.tree模块中,有哪些类型

 常用的:

分类树:tree.DecisionTreeClassifier

回归树:tree.DecisionTreeRegressor

画图用途:tree.export_graphviz

 Q:sklearn的基本建模流程

 Q:决策树的建模使用具体的语句

2.1重要参数

2.1.1criterion标准 

Q:criterion的类型?

 决策树中每一个节点都有不纯度。由上往下,不纯度越低,叶子节点是最低的

criterion参数有两类:entrophy信息熵和gini基尼系数

Q:entropy信息熵和gini基尼系数的两种不同数学算法

Q:数学公式代表的不同含义

 信息熵,来源于信息论的基本概念

信息越是不确定,信息熵越大。信息熵越低,信息越是有序

此处的criterion中的信息熵,是指计算信息熵的增益,也就是父节点到子节点信息熵的减少程度

Q:两种标准的区别

(1) 信息熵对不纯度更敏感,会有更强的惩罚措施,也就是说信息熵标准会分得更细࿰

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值