【实践】CTR中xgboost/gbdt +lr

最新推荐文章于 2023-02-06 16:41:14 发布

一寒惊鸿

最新推荐文章于 2023-02-06 16:41:14 发布

阅读量3.3w

点赞数 9

分类专栏： Python 广告/推荐

本文链接：https://blog.csdn.net/dengxing1234/article/details/73739836

版权

本文介绍了在点击率(CTR)预估中，如何使用GBDT和XGBoost作为特征选择工具，结合逻辑回归(LR)进行模型融合的实战方法。提供了基于Python 3.5.3、scikit-learn 0.18.1及xgboost 0.6的代码示例。

摘要由CSDN通过智能技术生成

自学习CTR预估中GBDT与LR融合方案，有意用简单暴利的python实现一版GBDT/XGboost做特征选择，融合LR进行CTR的代码demo。

1. GBDT + LR

python3.5.3 + scikit-learn0.18.1

from scipy.sparse.construct import hstack
from sklearn.model_selection import train_test_split
from sklearn.datasets.svmlight_format import load_svmlight_file
from sklearn.ensemble.gradient_boosting import GradientBoostingClassifier
from sklearn.linear_model.logistic import LogisticRegression
from sklearn.metrics.ranking import roc_auc_score
from sklearn.preprocessing.data import OneHotEncoder
import numpy as np

def gbdt_lr_train(libsvmFileName):

    # load样本数据
    X_all, y_all = load_svmlight_file(libsvmFileName)

    # 训练/测试数据分割
    X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, test_size = 0.3, random_state = 42)

    # 定义GBDT模