R系列之一 ----逻辑回归









require('data.table')
path = 'D:/当前地址模型/addr_sample.txt'
tb=fread(path,sep='\t',verbose = T,na.strings=c("NA","NULL",'NONE'),header = T,encoding='utf-8')
col = sapply(tb, class)
tb=fread(path,sep='\t',verbose = T,na.strings=c("NA","NULL"),header = T,colClasses = col)
colnames(tb) = gsub('curr_homeaddr_sample.','',colnames(tb),fixed = T)
colname = colnames(tb)
colname = colname[2:length(colname)]
tb = tb[,colname,with=F]
class(tb)


resultfull1=glm(tb$homeaddr_flag ~ tb$addr_cnt_woe+tb$addr_wt_woe+tb$addr_v_woe+
                  tb$ziying_work_cnt_woe+tb$ziying_rest_cnt_woe+
                  tb$pop_work_cnt_woe+tb$pop_rest_cnt_woe+tb$addr_last_woe+
                  tb$addr_type_woe+tb$addr_max_wt_woe+tb$addr_max_v_woe+
                  tb$beyod_cnt_woe+tb$spe_cate_cnt_woe,family=binomial,data=tb)


step(resultfull1,direction="backward")


step(resultfull1,direction="forward")


tb[is.na(tb)] <- 0


result=glm(tb$homeaddr_flag ~ tb$addr_cnt_woe+tb$addr_v_woe+
             tb$ziying_rest_cnt_woe+
             tb$pop_work_cnt_woe+tb$pop_rest_cnt_woe+tb$addr_last_woe+
             tb$addr_type_woe+tb$addr_max_v_woe+
             tb$beyod_cnt_woe+tb$spe_cate_cnt_woe,family=binomial,data=tb)






summary(result)
library(ROCR)
library(gplots)


pred=prediction(result$fit,tb$homeaddr_flag)
perf=performance(pred,"tpr","fpr")
plot(perf)
x=performance(pred,"auc")
x1=table(result$fit,tb$homeaddr_flag)
perf=performance(pred,"lift","rpp")
plot(perf)




predict <- predict(result,type='response',newdata=tb)
real <- tb$homeaddr_flag
x2=data.frame(real,predict)
res <- data.frame(real,predict =ifelse(predict>0.5,1,0),predict)






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值