计算 R 中的基尼系数
基尼系数是衡量数据集的不纯度或不平等性的指标之一。在 R 语言中,我们可以使用不同的包和函数来计算基尼系数。下面将介绍两种常用的方法:使用 caret
包和使用 rpart
包。
使用 caret
包
caret
包是 R 中一个强大的数据建模和机器学习工具包,它提供了计算基尼系数的函数。
首先,我们需要安装和加载 caret
包:
install.packages("caret") # 安装 caret 包
library(caret) # 加载 caret 包
接下来,我们准备一个示例数据集来计算基尼系数。假设我们有一个名为 data
的数据框,其中包含一个名为 target
的目标变量和其他特征变量。
data <- data.frame(
target = c("A", "B", "A", "B", "A"),
feature1 = c(1, 2, 3, 4, 5),
feature2 = c(&