决策树主要包括ID3,C4.5以及CART。下面给出三种算法的说明:
CART
首先看下面表格中的示例数据(随机生成,仅供参考)。其中年龄,身高,月收入为连续变量,学历,工作为离散变量。
- 如果把动心视为目标变量,此问题为分类问题。
- 如果把动心度视为目标变量,此问题为回归问题。
CART的目的是生成一个类似下面这样的树:分类树或者回归树。
叶子节点若为Y或者N,是分类树;若是数字,则为回归树。下面分别讲述回归树和分类树的生成方式。
分类树
D3算法使用信息增益来选择特
决策树主要包括ID3,C4.5以及CART。下面给出三种算法的说明:
CART
首先看下面表格中的示例数据(随机生成,仅供参考)。其中年龄,身高,月收入为连续变量,学历,工作为离散变量。
分类树
D3算法使用信息增益来选择特