决策树的定义:
分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成。结点有两种类型:内部结点(internal node)和叶结点(leaf node)。内部结点表示一个特征或属性(features),叶结点表示一个类(labels)。
用决策树对需要测试的实例进行分类:从根节点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子结点;这时,每一个子结点对应着该特征的一个取值。如此递归地对实例进行测试并分配,直至达到叶结点。最后将实例分配到叶结点的类中。
根节点(root node):它代表整个群体或样本,并且会进一步被划分为两个或更多个同质集合。
分裂(splitting):这是将节点划分为两个或更多个子节点的过程。
决策节点(decision node):当子节点拆分为更多的子节点时,称为决策节点。
叶/终端节点(leaf/terminal node):节点不分裂称为叶节点或终端节点。
修剪(prunning):当我们删除决策节点的子节点时,这个过程称为修剪。 你可以说分裂的相反过程。
分支/子树(branch/sub-tree):整个树的子部分称为分支或子树。
父子节点(parent and child node):被划分为子节点的节点被称为子节点的父节点,其中子节点是父节