1、简介
决策树学习是一种逼近离散值目标函数的方法,在统计学、数据挖掘、机器学习等领域都有应用。利用已有的数据样例集合,学习构造一颗决策树,便于以后预测目标数据的取值(比如分类时的类别等),这种决策树有时也被称作类别树或回归树。
2、决策树表示
决策树通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类。
下图画出了一颗典型的学习到的决策树,这棵树根据天气情况分类“是否打网球”。
比如:下面的实例将被沿着这可决策树的最左分支向下排列,因而被判定为反例。
<Outlook = Sunny,Temperature = Hot,Humidity = High,Wind = Strong>
通常决策树代表实例属性值约束合取的析取式,这种形式如(a ^ b ^ c) v(a ^ ~b ^ ~c ),上图表示的决策树对应于以下表达式: