决策树算法简介
1.什么是决策树?
从根节点一步步走向叶子节点(此过程叫决策),形成了决策树。
所有的数据都会进入叶子节点,构造完成决策树后,决策树可以用于分类或回归。
例如
根节点:第一个选择的分类节点。
非叶子节点与分支:中间过程。
叶子节点:决策过程。
在此图中的年龄小于15分类判断是根节点,是否男性属于非叶子节点与分支,三个最终的图片都属于叶子节点。
那么叶子节点是否是越多越好呢?
不是,如果叶子节点过多,会造成数据分类太过于详细,叶子节点的样本数据会过少,进而导致过拟合的发生。
决策树的训练与测试
1.训练
从训练集中构造出一棵树(从根节点开始选择特征,选择特征的原则是从分类效果最好的开始选起)。
2.测试
根据构造出来的树的模型从根节点开始到叶子节点走一遍。
重难点:如何构造出一个决策树?
根节点如何选择?
通过一种衡量标准,计算用不