- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 决策树的剪枝策略
决策树剪枝的目的去除训练树的过拟合问题,以维持树合理的深度及广度。按照剪枝的时段分可分为预剪枝及后剪枝。预剪枝是在树的生长时提前停止树的生长,后剪枝是在决策树生长完成后根据分枝节点的误差进行剪枝。不管是预剪枝还是后剪枝,在代码实现时,一个关键点是记录下节点的相关信息,包括到达该节点的训练样本数、当该节点作为叶子节点时的判定类别、错误样本数、节点的信息熵等。在此,首先定义节点类:
2015-01-26 16:55:29 1561
原创 决策树ID3算法
决策树模型是一种经典的分类算法,是通过一系列的判断规则对数据进行分类的过程。主要分为模型训练和类别预测两个阶段,在模型训练阶段通过有监督的学习得到一系列的规则,在预测阶段通过这些规则进行分类。此外,决策树也已经被扩展到回归分析中,可以分为分类决策树和回归决策树。决策树最早由JRossQuinlan于20世纪80年代提出,也就是经典的ID3算法,ID3算法通过选择最大的信息增益属性作为每一步分支
2015-01-25 10:25:51 1036
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人