R语言中基于C5.0的算法分析数据

上一篇博客说了R语言中利用朴素贝叶斯算法来预测垃圾短信,这次咱接着再聊一个算法,C5.0。我个人感觉C5.0要好用一点的。主要是C5.0对数据的属性没有硬性要求,不像贝叶斯中,数据的属性非no及yes,这在众多的工作场景中是无法得到保证的。就比如分析关于银行贷款的个人信用问题。其中就有不少属性可以去很多值的(就像存款,是一个多段值)。

代码如下:

credit<-read.csv("credit.csv",stringsAsFactors = FALSE)
str(credit)
prop.table(table(credit$default))
credit$default<-factor(credit$default)
set.seed(666)
credit<-credit[order(runif(1000)),]
credit_train<-credit[1:900,]
credit_test<-credit[901:1000,]
install.packages("C50")
library(C50)
credit_model<-C5.0(x = credit_train[-17],y = credit_train$default)
credit_model
credit_pred<-predict(object = credit_model,newdata = credit_test)
library(gmodels)
CrossTable(credit_test$default,credit_pred,dnn = c("Actual","Predict"))

分析:

1.为什么要

credit<-credit[order(run
  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值