在R语言中我们用LDA算法的做预测的时候包,主要的MASS包。在这里我就不对于LDA算法进行详细的描述,只是根据问题的需求用R语言解决问题。我们使用的数据是KKNN包中的自带数据miete数据。主要对于该数据进行划分:1/3为测试数据,2/3为训练数据,通过对于数据的观察,预测测试数据中的nmkat对应的值。
观察数据:
library(kknn)
data("miete")
head(miete)
dim(miete)
summary(miete)
划分数据:1/3测试数据,2
/3训练数据
####等样抽取
library(sampling)
n=round(2/3*nrow(miete)/5)
n
sub_train=strata(miete,stratanames="nmkat",size=rep(n,5),method="srswor")
head(sub_train)
#剔除1、3、12 属性
data_train=getdata(miete[,c(-1,-3,-12)],sub_train$ID_unit)
data_test=getdata(miete[,c(-1,-3,-12