决策树
输入数据应包括训练集和属性集(暂不考虑测试集)
这里应首先明确三个概念:类,属性,属性判定。这对于后面分支叶节点的判定非常重要。
首先,说类,类就是判定结果。比如在本书中就是,好瓜、坏瓜就是两个类,也可称类别。
其次,是属性,属性就是输入所有特征的全部情况,比如在本书中,瓜的色泽,瓜的纹理等。
最后,属性判定,是说具体训练集中数据中的属性值,比如本书中,瓜的深绿色,浅绿色,文理清晰,模糊等。
决策树
输入数据应包括训练集和属性集(暂不考虑测试集)
这里应首先明确三个概念:类,属性,属性判定。这对于后面分支叶节点的判定非常重要。
首先,说类,类就是判定结果。比如在本书中就是,好瓜、坏瓜就是两个类,也可称类别。
其次,是属性,属性就是输入所有特征的全部情况,比如在本书中,瓜的色泽,瓜的纹理等。
最后,属性判定,是说具体训练集中数据中的属性值,比如本书中,瓜的深绿色,浅绿色,文理清晰,模糊等。