本文介绍caret包中的建立模型及验证的过程。主要涉及的函数有train(),predict(),confusionMatrix(),以及pROC包中的画roc图的相关函数。
建立模型
在进行建模时,需对模型的参数进行优化,在caret包中其主要函数命令是train。
train(x, y, method = "rf", preProcess = NULL, ..., weights = NULL, metric = ifelse(is.factor(y), "Accuracy", "RMSE"), maximize = ifelse(metric %in% c("RMSE", "logLoss", "MAE"), FALSE, TRUE), trControl = trainControl(), tuneGrid = NULL, tuneLength = ifelse(trControl$method == "none", 1, 3))
- x 行为样本,列为特征的矩阵或数据框。列必须有名字
- y 每个样本的结果,数值或因子型
- method 指定具体的模型形式,支持大量训练模型,可在此查询:点击
- preProcess 代表自变量预处理方法的字符向量。默认为空,可以是 "BoxCox", "YeoJ