4.1基本流程
决策树(decision tree):一种常见的机器学习方法
仍然以西瓜为例,才用决策树的方法,我们怎么样才能分辨这个西瓜是好瓜呢?
我们处理事情一般只看最终结果,显然决策的过程的最终结论对应的也是我们希望的判定结果。
一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;书上讲的比较模糊,下面我来总结一下
根节点:包含所有样本(各种各样的瓜)
内部节点:西瓜的属性(色泽=?,根蒂=?,敲声=?,...)
叶节点:结论(好瓜,坏瓜)。
每条从根节点到叶节点的路径就代表一种属性判定路径。
决策树学习的目的就是为了产生一棵泛化能力强,即处理未见实力能力强的决策树。其基本流程遵循“分而治之”策略.
本图中,决策树学习的关键在第8行,这一点我们在4.2划分选择中讲解
决策树的结构是一个递归的过程,有三种情形会导致递归返回
内容一:输入的数据集以及属性集,很好理解(各种各样的西瓜及属性)&#