课程是全面讲解sklearn包官网的应用
2.决策树
Q:决策树是什么?
非参数的有监督的学习方法。
主要用于解决分类和回归问题
把包含特征的列表,转成树状图的方式
Q:特别概念
进边与出边的区别是,箭头指哪里
叶子节点是最末端,中间节点是中间。
Q:使用决策树需要解决的两个问题
根据数据表画出最好的树,同时控制树的高度
Q:sklearn.tree模块中,有哪些类型
常用的:
分类树:tree.DecisionTreeClassifier
回归树:tree.DecisionTreeRegressor
画图用途:tree.export_graphviz
Q:sklearn的基本建模流程
Q:决策树的建模使用具体的语句
2.1重要参数
2.1.1criterion标准
Q:criterion的类型?
决策树中每一个节点都有不纯度。由上往下,不纯度越低,叶子节点是最低的
criterion参数有两类:entrophy信息熵和gini基尼系数
Q:entropy信息熵和gini基尼系数的两种不同数学算法
Q:数学公式代表的不同含义
信息熵,来源于信息论的基本概念
信息越是不确定,信息熵越大。信息熵越低,信息越是有序
此处的criterion中的信息熵,是指计算信息熵的增益,也就是父节点到子节点信息熵的减少程度
Q:两种标准的区别
(1) 信息熵对不纯度更敏感,会有更强的惩罚措施,也就是说信息熵标准会分得更细