基尼系数(Gini index)反映的是从数据集D中随机选取两个样本,其类别标记不一致的概率。因此,基尼系数越小,数据纯度越高。
G
i
n
i
(
D
)
=
1
−
∑
k
=
1
∣
γ
∣
p
k
2
.
Gini(D)=1-\sum_{k=1}^{|\gamma|}{p_k^2}.
Gini(D)=1−∑k=1∣γ∣pk2.
基尼指数 Gini Index
最新推荐文章于 2025-03-18 13:57:37 发布