简介
Regression Tree:回归树
Classification And Regression Tree(CART)
用树形结构处理回归问题,每个节点都是对一个属性值的二分类。
将输入空间划分为M个单元,每个单元的值为该单元内所有样本的均值
基本方法
算法流程
自顶向下贪婪式递归,启发式搜索
TreeGenerate(D,X)
- if 达到停止条件 then return 叶子节点(为D均值)
- 生成节点node
- for
x
i
x_i
xi in X
- for s in range(
x
i
x_i
xi)
- s为界,计算划分后的RSS
- 记录使RSS最小的s和 x i x_i xi,记为 s m , x m s_m,x_m sm,xm
- for s in range(
x
i
x_i
xi)
- 以 s m , x m s_m,x_m sm,xm为划分依据进行划分。
- 左孩子TreeGenerate(D \ Di ,X \ Xi), 右孩子。。。
停止条件
- 最大深度
- 节点样本数
- 计算分类是否有益