> By joey周琦
概述
- 线性模型一般variance小,bias大;而树模型一般variance大,bias小
- 决策树的优点:具有可读性,分类速度快
- 一般包含三个步骤:
- 特征选择
- 决策树生成
- 剪枝
- 决策树定义:分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成。结点分为内部结点和叶结点,内部结点表示一个特征(feature),外部结点表示一个类。
- 决策树可以看为一个if-then规则集合,具有“互斥完备”性质
决策树学习
假设有数据集
D={
(x1,y1),(x2,y2),...(xN,yN)}
其中 xi=(x1i,x2i,...xni) , 为输入特征向量,n为特征的数目.