R语言中的混淆矩阵和分类结果评估
在机器学习和数据科学中,评估分类模型的性能是非常重要的一步。混淆矩阵是一种常用的工具,用于可视化和衡量分类模型的预测结果。R语言提供了一个方便的函数confusionMatrix,可以计算和展示混淆矩阵,帮助我们评估分类模型的准确性。
首先,我们需要安装并加载适当的R包。在本例中,我们将使用"caret"和"e1071"包来演示混淆矩阵的计算和展示。
# 安装包
install.packages("caret")
install.packages("e1071")
# 加载包
library(caret)
library(e1071)
接下来,我们将创建一个简单的分类模型,以演示如何使用confusionMatrix函数。在本例中,我们将使用鸢尾花数据集(iris),这是一个经典的分类问题。
# 加载鸢尾花数据集
data(iris)
# 将数据集分为训练集和测试集
set.seed(123)
trainIndex <- createDataPartition(iris$Species, p = 0.8, list = FALSE)
trainData <- iris[trainIndex, ]
testData <- iris[-trainIndex, ]
# 创建分类模型
model <- svm(Species ~ ., data = trainData)
# 在测试集上进行预测
predictions <- predict(model, testData)
现在,我们已经有了模型的预测结果。接下来,我们可以使用confusionMatrix