1.决策树模型
决策树模型基于‘树的结构’进行决策。
- 每个内部节点对应某个属性的‘测试’。
- 每个分支对应于某个测试的一种可能结果(即该属性上的某个取值)。
- 每个‘叶节点’对应于一个‘预测结果’。
学习过程:通过对训练样本的分析来确定‘划分属性’。(内部节点的属性)
预测过程:将测试事例从根节点开始,沿着划分属性所构成的‘判定测试序列’下行,直到叶节点。
2.算法流程和最佳属性选择
决策树的基本流程:
- 总体流程:分而治之 在每个中间节点寻找一个‘划分’属性
- 三种停止条件:当前节点包含的样本全属于同一类别,无需划分(样本不一样属性一样划分个啥);当前属性集为空,或是所有样本在所有属性上取值相同,无法划分(样本都一样没办法);当前节点包含的样本集合为空,不能划分(没样本了)。
- 基本流程: