首先通过两个图来引入什么是决策树。
是否学习的决策过程
决策树是仿树结构来进行决策的,例如上图来说,我们要对‘是否学习’这个问题进行决策时,通常伴随一系列的子决策。先看是否有‘对象’,有的话是否需要‘陪伴对象’,通过一次次子决策后得到最终决策:是否学习。
一般情况下,一棵决策树包含一个根节点,若干内部节点和若干叶节点,如下图所示,那么与是否学习的决策过程对应起来,‘女票’为根节点,'陪女友'和‘任务’‘吃鸡’为内部节点,最下面一层为叶子节点。
决策树节点图
决策树算法第一种常见的机器学习方法,常用于分类任务中,从给定的训练数据集中学习到一个模型用于对新示例进行分类。决策树需要两部分数据:
训练数据:用于构造决策树,即决策机制
测试数据:验证所构造决策树的错误率
下面给出决策树学习算法伪代码:
决策树学习算法伪代码
下面我们以一个具体的小实例来讲解决策树算法
数据为一个简单的判别生物是否为鱼类的数据集,通过对下面数据进行分析,建立决策树。
序号
不浮出水面是否可以生存
是否有脚蹼
属于鱼类
1
是
是
是
2
是
是