文件“"Smarket.sv”为2001 2005年S8P 500指数的日交易情况,其中,laa1.laa2.a3.a4.laa5为对于交日当天相对前5连续交易日中每易日的涨跌数额、Volume为前一交易日的交易量、Today为交易日当天的涨跌数额、Direction为交易日当天的“涨”或“跌情。请使用R 读取该数据文件中的数据及构建分类模型,并回答下列问题:
1、以lag1,lag2.lag3,ag5和Volume为特征,使用折交叉验证方法(K=10)计算K-NN模型参数k在不同取值情况下的模型的准确率.
data <- read.csv("Smarket.csv")
features <- c("Lag1", "Lag2", "Lag3", "Lag4", "Lag5", "Volume") # 选择特征
data <- data[, c(features, "Direction")] # 保留特征和目标5量
library(caret)
# 创建控制参数
ctrl <- trainControl(method = "cv", number = 10) # 10 折交叉验证
# 使用 train() 函数执行 K-NN 模型
model <- train(Direction ~ ., data = data, method = "knn", trControl = ctrl, tuneGrid = expand.grid(k = 1:20))
best_k <- model$bestTune$k # 最佳 k 值
accuracy <- model$results[model$results$k == best_k, "Accuracy"] # 最佳 k 值下的准确率
accuracy