前言
决策树是很常见的机器学习分类算法,竟然叫决策树,那么它的模型其实就像树一样。通过对样本集的学习,挖掘出有用的规则。对于程序员来说或许以条件语句来看就更好理解了,决策树可以看成是多个if then条件语句的集合。这种模型等同于我们写的条件语句,所以它的预测分类速度是很快的。
例子
来个例子了解下决策树分类过程,以女生相亲挑“高富帅”为例吧,遇到已婚的肯定是不交往了,在未婚的情况下接着要看是否有房产,没有的话也免谈了,有房产那么继续看身高,180cm以上的接受,而180cm以下则再看有没有两套房,有则可以弥补身高不足,否则则拒绝。
一般一棵决策树包含了一个根节点、若干个内部节点(图中圆形节点)和若干个叶节点(图中方形节点),内部节点用于描述一种属性,而叶节点用来表示分类的结果。