1、为四个布尔属性A,B,C和D的奇偶函数画一棵完全决策树。可以简化该决策树吗?
解:
不能简化该决策树
2、考虑如下表二元分类问题的训练样本。
(a)计算整个训练样本集的GINI指标值。
(b)计算属性顾客ID的Gini指标值。
(c)计算属性性别的Gini指标值。
(d)计算使用多路划分属性车型的Gini指标值。
(e)计算使用多路划分属性衬衣尺码的Gini指标值。
(f)下面哪个属性更好,性别、车型还是衬衣尺码?
(g)解释为什么属性顾客ID的Gini值最低,但却不能作为属性测试条件。
解:
(a)计算整个训练样本集的GINI指标值。
(b)计算属性顾客ID的Gini指标值。
每个顾客的Gini指标值为0,所以属性顾客ID的Gini指标值为0
(c&#x