决策树的基尼系数计算过程
1、基尼指数的计算
在介绍具体的计算之前,先从一个例子入手吧。
先看看下面这个数据,我们需要通过前三列的特征来推断出最后一列是yes,no
1、数据
Chest Pain
Good Blood Circulation
Blocked Arteries
Heart Disease
No
No
No
No
Yes
Yes
Yes
Yes
Yes
Yes
No
No
Yes
No
???
Yes
etc…
etc…
etc…
etc…
2、统计
Chest Pain
true
Heart Disease
Yes:105
No:39
false
Heart Disease
Yes:34
No:125
Good Blood Circulation
true
Heart Disease
Yes:37
No:127
false
Heart Disease
Yes:100
No:33
Blocked Arteries
true
Heart Disease
Yes:92
No:31
false