《R语言与数据挖掘》⑥-④分类与预测建模【KNN算法】

最新推荐文章于 2023-06-16 08:52:46 发布

Wency(王斯-CUEB)

最新推荐文章于 2023-06-16 08:52:46 发布

阅读量1.4k

点赞数 2

分类专栏： R语言 AI算法机器学习文章标签： r语言数据挖掘算法

本文链接：https://blog.csdn.net/weixin_43213884/article/details/122116263

版权

机器学习同时被 3 个专栏收录

48 篇文章 15 订阅

订阅专栏

R语言

38 篇文章 32 订阅

订阅专栏

AI算法

8 篇文章 0 订阅

订阅专栏

KNN 算法即K最近邻(k-Nearest Neighbor)分类算法，是一个理论上比较成熟的方法。
在这里插入图片描述

kknn()函数

在这里插入图片描述

knn()函数

在这里插入图片描述

train()函数

在这里插入图片描述


# KNN算法
setwd("F:\\桌面")  # 设置工作空间
Data <- read.csv("./test.txt",sep = '\t')  # 读入数据
Data[, "MN"] <- as.factor(Data[, "MN"])  # 将目标变量转换成因子型
set.seed(1234)  # 设置随机种子
# 数据集随机抽70%定义为训练数据集，30%为测试数据集
ind <- sample(2, nrow(Data), replace = TRUE, prob = c(0.7, 0.3))
traindata <- Data[ind == 1, ]
testdata <- Data[ind == 2, ]

# 使用kknn函数建立knn分类模型 
library(kknn)  # 加载kknn包
# knn分类模型
kknn.model <- kknn(MN ~ ., train = traindata, test = traindata, k = 5)  # 训练数据
kknn.model2 <- kknn(MN ~ ., train = traindata, test = testdata, k = 5)  # 测试数据
summary(kknn.model)  # 输出模型概要
# 预测结果
train_predict <- predict(kknn.model)  # 训练数据
test_predict <- predict(kknn.model2)  # 测试数据
# 输出训练数据的混淆矩阵
(train_confusion <- table(actual = traindata$MN, predictedclass = train_predict)) 
# 输出测试数据的混淆矩阵
(test_confusion <- table(actual = testdata$MN, predictedclass = test_predict))

# 使用knn函数建立knn分类模型
library(class)  # 加载class包
# 建立knn分类模型
knn.model <- knn(traindata, testdata, cl = traindata[, "MN"]) 
# 输出测试数据的混淆矩阵
(test_confusion = table(actual = testdata$MN, predictedclass = knn.model))

# 使用train函数建立knn分类模型
library(caret)  # 加载caret包
# 建立knn分类模型
train.model <- train(traindata, traindata[, "MN"], method = "knn")
# 预测结果
train_predict <- predict(train.model, newdata = traindata)      #训练数据集
test_predict <- predict(train.model, newdata = testdata)       #测试数据集
# 输出训练数据的混淆矩阵
(train_confusion <- table(actual = traindata$MN, predictedclass = train_predict))
# 输出测试数据的混淆矩阵
(test_confusion <- table(actual = testdata$MN, predictedclass = test_predict))