【Matlab】基于决策树DT实现多分类预测(Excel可直接替换数据))
1.算法简介
1.1 算法原理
- 决策树是一种特别简单的机器学习分类算法。决策树想法来源于人类的决策过程,是在已知各种情况发生概率的基础上,通过构成决策树来评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。
- 由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,其代表的是对象属性与对象值之间的一种映射关系。
- 决策树可看作一个树状预测模型,它是由结点和有向分支组成的层次结构。树中包含3种结点:根结点、内部结点、叶子结点。
- 决策树只有一个根结点,是全体训练数据的集合。树中每个内部结点都是一个分裂问题:指定了对实例的某个属性的测试,它将到达该结点的样本按照某个特定的属性进行分割,并且该结点的每一个后继分支对应于该属性的一个可能值。
- 每个叶子结点是带有分类标签的数据集合,即为样本所属的分类。
1.2 算法优点
- 决策树易于理解和实现,用户在学习过程中不需要了解过多的背景知识,其能够直接体现数据的特点,只要通过适当的解释,用户能够理解决策树所表达的意义。
- 速度快,计算量相对较小,且容易转化成分类规则。只要沿着根结点向下一直走到叶子结点,沿途分裂条件是唯一且确定的。
1.3 算法缺点
- 主要是在处理大样本集时,易出现过拟合现象,降低分