Kaggle:Give me some credit(2)

3.特征工程

3.1特征提取

根据Num30-59,Num60-89,Num90创建一个型变量,将其加总后的值大于1的设定为因子"1"和"0"表示逾期和未预期。

traindata$All<-traindata$Num30.59+traindata$Num90+traindata$Num60.89
traindata$All<-ifelse(traindata$All>1,1,0)

3.2 切分数据

利用caret包中的createDataPartition(数据分割功能)函数将数据随机分成相同的两份。训练集和测集的结果是平衡的,大致都为6.6%左右,因此可以采用这份切割的数据进行建模及预测。


set.seed(123) 
splitIndex<-createDataPartition(traindata$y,time=1,p=0.5,list=FALSE)    #切分数据集
train<-traindata[splitIndex,-ncol(traindata)] 
test<-traindata[-splitIndex,-ncol(traindata)] 
prop.table(table(train$y)) 
prop.table(table(test$y))

prop.table(table(train$y))

     0          1 

0.93764043 0.06235957

prop.table(table(test$y))

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值