R语言练习-利用决策树模型分析泰坦尼克生还率
二、决策树模型
使用rpart模型的原因:
泰坦尼克数据中含有NA值,使用rpart能够处理为代理变量
1、rpart决策树模型
去掉不适合的列,如name
library(rpart)
library(foreach)
folds<-create_ten_fold_cv()
rpart_result<-foreach(f=folds) %do%{
model_rpart<-rpart(
survived~pclass+sex+age+sibsp+parch+fare+embarked,
data=f train)predicted<−predict(model