决策树,从名字上看,就知道其模型的结构为树结构,决策树既可以用于分类,也可以用于回归之中。在分类问题中,我们可以认为其是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。在学习过程中,利用训练数据和损失函数最小化的原则来构建决策树模型,在分类过程,利用模型对新数据进行分类。直接构建模型,说明决策树是一个判别模型。在学习过程,决策树有主要的三个步骤:特征选择,决策树的生成,决策树的修剪。根据三个步骤的不同,出现了三种决策树的算法:ID3,C4,5,CART.
决策树模型是树结构,树中存在二种结点,一种是分支结点,对于分支结点,代表了特征或属性,另一种是叶子结点,对于叶子结点,代表了类别。分支结点代表了属性对于特征空间的划分。决策树与if-then规则紧密联系,对于从根结点到叶节点的一条路径对应一条规则。决策树学习到的模型其实也可以转变为给定特征条件下