决策树
由于我们是使用sklearn对决策树代码进行实现,所以并不是很关心其原理部分。但我仍需要对其进行一定的了解。通过查询资料,去学习了下决策树的原理,这里对其原理进行简要介绍。
注:这里决策树的原理是通过这个网站来学习的,这里只做记录。
机器学习实战教程(二):决策树基础篇之让我们从相亲说起 (cuijiahua.com)
决策树原理
决策树是一种基本的分类与回归方法。决策树可以这样理解为:由决策树的根结点到叶结点的每一条路径构建一条规则,路径上内部结点的特征对应着规则的条件,而叶结点的类对应规则的结论。
分类决策树
分类决策树模型是一种描述对实例进行分类的树形结构。
决策树构成
决策树由结点和有向边组成。
结点类型
有两种类型内部结点和叶结点
内部结点
表示一个特征或者属性
叶结点
表示一个类
构造决策树
一般可以分为特征选择、决策树生成、决策树修剪
特征选择
特征选择在于选取对训练数据具有分类能力的特征。这样可以提高决策树学习的效率。通常特征选择的标准是信息增益或信息增益比。