R语言练习-利用决策树模型分析泰坦尼克生还率(3)

R语言练习-利用决策树模型分析泰坦尼克生还率

三、利用ticket识别家庭,后分析

1.添加家庭号

#计算各家庭成员的生还率
f$train$type<-"T"
f$validation$type<-"V"
all<-rbind(f$train,f$validation)
ctree_model<-ctree(
    survived~pclass+sex+age+sibsp+parch+fare+embarked,
    data=f$train
  )
all$prob<-sapply(
  predict(ctree_model,newdata=all,
                     type="prob"),
  function(result){
   result[1]})
#添加家庭ID
library(plyr)
family_idx<-0
ticket_based_family_id<-ddply(all,.(ticket),function(rows){
   
  family_idx<<-family_idx+1  #family_idx是在函数外部声明的变量,使用<<-运算符进行赋值
  return(data.frame(f
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值