文章目录 Decision Trees 决策树 建立决策树分类模型的流程 如何建立决策树? 决策树学习 表达能力 决策树学习 信息论在决策树学习中的应用 特征选择准则一:信息增益 举例 结论 不足 回到餐厅的例子 从12个例子中学到的决策树: Decision Trees 决策树 什么是决策树 —— 基本概念 非叶节点:一个属性上的测试,每个分枝代表该测试的输出 叶节点:存放一个类标记 规则:从根节点到叶节点的一条属性取值路径 建立决策树分类模型的流程 模型训练:从已有数据中生成一棵决策树 分裂数据的特征,寻找决策类别的路径 相同的数据,根据不同的特征顺序,可以建立多种决策树 如何建立决策树? 基本的决策树学习过程,可以归纳为以下三个步骤: 特征选择:选取对于训练数据有着较强区分能力的特征 生成决策树:基于选定的特征,逐步生成完整的决策树 决策树剪枝:简化部分枝干,避免过拟合因素影响