可复制数据集在如下评论第一条!
第1步计算决策属性的熵 | ||
S1 (买) = | 641 | |
S2(不买)= | 383 | |
S= S1+S2 = | 1024 | |
P1=641/1024= | 0.625976563 | |
P2=383/1024= | 0.374023438 |
第二步计算各类属性的熵 | |||||||
分类属性共有4个。分别是年龄、收入、学生、信誉。 | |||||||
分别计算不同属性的信息增益 |
年龄信息增益=0.9537-0.6877=0.2660 | |||
收入信息增益=0.9537-0.9361=0.0176 | |||
学生信息增益=0.9537-0.7811=0.1726 | |||
信誉信息增益=0.9537-0.9048=0.0453 |