树模型系列之六:基于R语言的xgboost+LR实现方法及案例

本文详述如何结合Xgboost和逻辑回归(LR)在R语言中构建分类模型,通过实例展示了算法原理及具体操作,包括Xgboost创建新特征和LR的特征组合与权重计算。
摘要由CSDN通过智能技术生成

本文主要介绍如何利用Xgboost+LR构建分类模型,基于真实案例用R语言来实现该算法。


一、算法原理

Xgboost可以用来构造新特征变量,而LR则可以把原始特征和新特征集合起来构造模型,并计算各特征的显著性和权重系数。



二、利用R构造Xgboost模型

原始数据,数据框格式,8个自变量,1个因变量,训练集共200万+数据,测试集90万+数据。

# 利用xgboost包的xgb.create.features构造新特征变量
library(xgboost)

traindata1 <- data.matrix(traindata[,c(1:8)]) # 将自变量转化为矩阵
library(Matrix)
traindata2 <- Matrix(traindata1,sparse=T) # 利用Matrix函数,将sparse参数设置为TRUE,转化为稀疏矩阵
traindata3 <- as.numeric(as.character(traindata[,9])) # 将因变量转化为numeric
traindata4 <- list(data=traindata2,label=traindata3) # 将自变量和因变量拼接为list
dtrain <- xgb.DMatrix(data = traindata4$da
  • 7
    点赞
  • 91
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值