R语言练习-利用决策树模型分析泰坦尼克生还率（3）

最新推荐文章于 2023-07-04 23:21:09 发布

宁静致远oTo

最新推荐文章于 2023-07-04 23:21:09 发布

阅读量1.4k

点赞数

分类专栏： r语言与数据分析文章标签： r语言数据分析-机器学习

本文链接：https://blog.csdn.net/wu_jing_01/article/details/78710155

版权

本文是R语言练习的第三部分，通过分析泰坦尼克乘客的票号来识别家庭成员，并根据年龄区分父母和子女。接着，计算了父母和子女的平均生还率，并用ctree模型进行生还率预测。

摘要由CSDN通过智能技术生成

R语言练习-利用决策树模型分析泰坦尼克生还率

三、利用ticket识别家庭，后分析

1.添加家庭号

#计算各家庭成员的生还率
f$train$type<-"T"
f$validation$type<-"V"
all<-rbind(f$train,f$validation)
ctree_model<-ctree(
    survived~pclass+sex+age+sibsp+parch+fare+embarked,
    data=f$train
  )
all$prob<-sapply(
  predict(ctree_model,newdata=all,
                     type="prob"),
  function(result){
   result[1]})
#添加家庭ID
library(plyr)
family_idx<-0
ticket_based_family_id<-ddply(all,.(ticket),function(rows){
   
  family_idx<<-family_idx+1  #family_idx是在函数外部声明的变量，使用<<-运算符进行赋值
  return(data.frame(f

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

宁静致远oTo

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
R语言练习-利用决策树模型分析泰坦尼克生还率（3）

R语言练习-利用决策树模型分析泰坦尼克生还率三、利用ticket识别家庭，后分析1.添加家庭号#计算各家庭成员的生还率f$train$type<-"T"f$validation$type<-"V"all<-rbind(f$train,f$validation)ctree_model<-ctree( survived~pclass+sex+age+sibsp+parch+fare+em
复制链接

扫一扫