KNN高维空间很难找邻居(curse of dimensionality)
分类树的预测非常简单,just drop an observation down the tree(回答一系列的是或否问题),使用多数票规则(majority vote rule)
CART算法使用“二叉树”(binary tree),本质上将“特征空间”(feature space)进行递归分割(recursive partitioning),每次总是沿着与某个变量x轴平行的方向进行切割,切成矩形区域。
节点不纯度函数(Node Impurity Functions)
分类树
选择什么变量(split variable)进行分裂?
目标:使得分裂之后的两个子节点内部的