xgboost分类_xgboost的原生接口与sklearn接口

最新推荐文章于 2024-04-25 14:09:26 发布

weixin_39574050

最新推荐文章于 2024-04-25 14:09:26 发布

阅读量759

点赞数 1

文章标签： xgboost分类

本文探讨了xgboost在分类任务中使用原生接口和sklearn接口的区别。sklearn接口简化了流程，无需标签标准化，但模型保存后无法增量训练。原生接口则需要标签和输入数据标准化，且输出结果需反标签标准化，但支持更多训练操作。

摘要由CSDN通过智能技术生成

本文解决我问题时：xgboost在使用时原生接口和sklearn接口的异同

首先放上官方中文文档

https://xgboost.apachecn.org/#/xgboost.apachecn.org

2. xgboost的sklrean接口

from xgboost.sklearn import XGBClassifier
xgbc = XGBClassifier(n_jobs=-1)  # 新建xgboost sklearn的分类class
# xgboost的sklearn接口默认只使用cpu单线程，设置n_jobs=-1使用所有线程

print("开始xgboost classifier训练")
xgbc.fit(train_vector,np.array(train_label))
# 喂给分类器训练numpy形式的训练特征向量和标签向量
    
print("完成xgboost classifier训练，开始预测")
pre_train_Classifier = xgbc.predict(test_vector)   # 喂给分类器numpy形式的测试特征向量
np.save(os.path.join(model_path,"pre_train_Classifier.npy"),pre_train_Classifier)  # 保存结果

xgboost的sklearn接口，可以不经过标签标准化(即将标签编

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39574050

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

XGBoost原生接口和Sklearn接口参数详解

算法工程师

04-21

1970

XGBoost原生接口和Sklearn接口参数详解

ML之XGBoost：XGBoost案例应用实战(原生接口实现+Scikit-learn接口实现)

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

07-24

1万+

ML之XGBoost：XGBoost案例应用实战(原生接口实现+Scikit-learn接口实现) 目录 XGBoost原生接口实现 Scikit-learn接口实现相关文章ML之XGBoost：XGBoost算法模型(相关配图)的简介(XGBoost并行处理)、关键思路、代码实现(目标函数/评价函数)、安装、使用方法、案例应用之详细攻略ML之X...

参与评论您还未登录，请先登录后发表或查看评论

【ML】Xgboost接口及使用

0x00

10-14

507

xgboost原理，接口及使用案例

Xgboost: 自带接口与sklearn接口的简单使用及对比

anshuai_aw1的博客

10-09

7575

众所周知，Xgboost有两个接口，分别是自带的接口和sklearn接口。在Xgboost的官方文档中，我们可以看到其详细的使用方法。接下来，我们通过代码的方式对这两种接口进行对比。第一步：数据集的准备 from sklearn.model_selection import train_test_split from pandas import DataFrame from sklea...

XGBoost的原生接口和xgboost库接口对比

weixin_44766179的博客

08-26

3161

1、XGBoost原生接口----分类 import numpy as np from sklearn.datasets import load_iris from sklearn.metrics import accuracy_score from sklearn.model_selection import train_test_split import xgboost as xgb dat...

（三）XGBoost数据接口

Haward

07-23

1565

import xgboost as xgb #数据接口: (1)逗号分隔值（CSV）文件 (2)NumPy 2D阵列 (3)XGBoost二进制缓冲区文件 #1.将CSV文件加载到DMatrix(train.csv是文件名，第0列是lable) # label_column specifies the index of the column containing the true la...

xgboost原生接口和sklearn的区别

大数据ING的博客

09-20

1425

1、区别如图： 2、（1）原生形式使用Xgboost(import xgboost as xgb) from sklearn import datasets from sklearn.model_selection import train_test_split import xgboost as xgb import numpy as np from sklearn.metrics import precision_score, recall_score # 加载数据 iris .

sklearn中的xgboost_XGBoost的介绍、应用、调参、知识点

weixin_39604092的博客

11-18

1195

XGBoost XGBoost是一个优化的分布式梯度增强库，旨在实现高效，灵活和便携。安装python库文件安装:pip install xgboost 高阶安装可以参考：这里xgboost.apachecn.org简介XGBoost，Extreme Gradient Boosting。其基于梯度提升决策树 gradient boosted tree（GBDT/GBRT/GBM）。主要应用于监督...

python xgboost用法_XGBoost类库使用小结

weixin_42467411的博客

01-14

1369

在XGBoost算法原理小结中，我们讨论了XGBoost的算法原理，这一片我们讨论如何使用XGBoost的Python类库，以及一些重要参数的意义和调参思路。1. XGBoost类库概述XGBoost除了支持Python外，也支持R，Java等语言。本文关注于Python的XGBoost类库，安装使用"pip install xgboost"即可，目前使用的是XGBoost的0.90版本。XGBo...

sklearn与XGBoost库xgboost算法参数总结

帅泽泽的博客

12-27

4490

1 sklearn与XGBoost 1.2 xgboost库与XGB的sklearn API 1.3 XGBoost的三大板块 2 梯度提升树 2.1 提升集成算法：重要参数n_estimators 2.2 有放回随机抽样：重要参数subsample 2.3 迭代决策树：重要参数eta 3 XGBoost的智慧 3.1 选择弱评估器：重要参数booster 3.2 XGB的目标函数：重要参数objective 3.3 求解XGB的目标函数 3.4 参数化决策树：参数alpha， lambda 3.5 寻

Xgboost版本对比（原生版与sklearn接口版）

dzysunshine的博客

08-21

5527

文章目录1. 分别使用两个版本对同一个数据集进行测试1.1 数据集的准备1.2 用两个版本设定相同的参数，对数据集进行训练1.3 将评估结果打印出来2. 两个版本的区别参考看过别人使用Xgboost会发现它是由有两个版本的，分别是xgboost的python版本有原生版本和为了与sklearn相适应的sklearn接口版本，现在就简单总结下二者的区别。这里放上Xgboost中文文档，以及XGB...

Sklearn XGBoost模型算法分类建模-----风控项目实战（PR曲线、KS、AUC、F1-Score各类指标）

weixin_41025946的博客

12-21

3464

XGBOOST分类模型，风控建模实战，F1-SCORE、KS、PR曲线、AUC等详细代码图解

xgboost算法 c语言,xgboost与sklearn的接口

weixin_35510761的博客

05-24

641

XGBoost线性回归工控数据分析实践案例（Sklearn接口篇）

肖永威的专栏

08-13

5816

XGB Regressor工控实践。

xgboost与sklearn的接口

weixin_30838921的博客

12-10

1576

机器学习：基于Sklearn、XGBoost框架，使用XGBClassifier、支持向量分类器和决策树分类器预测乳腺癌是良性还是恶性

热门推荐

lyy的博客

10-23

4万+

前言 1，Xgboost简介　　Xgboost是Boosting算法的其中一种，Boosting算法的思想是将许多弱分类器集成在一起，形成一个强分类器。因为Xgboost是一种提升树模型，所以它是将许多树模型集成在一起，形成一个很强的分类器。而所用到的树模型则是CART回归树模型。　　Xgboost是在GBDT的基础上进行改进，使之更强大，适用于更大范围。　　Xgboost一般和sk...

机器学习实践(1.1)XGBoost分类任务

LMTX069的博客

06-16

2097

XGBoost分类任务的简单实现

Xgboost建模，sklearn评估,分类问题用混淆矩阵，回归问题用MSE

缘源园

03-23

4587

import xgboost as xgb import numpy as np import pickle from sklearn.model_selection import KFold, train_test_split, GridSearchCV from sklearn.metrics import confusion_matrix, mean_squared_error #混淆矩阵，均方误差 from sklearn.datasets import load_iris, load_digit.

sklearn xgboost

06-02

sklearn中也集成了XGBoost的模型，使用起来比较简单。下面是一个使用sklearn中XGBoost进行分类的Python代码示例： ```python import xgboost as xgb from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 data = load_breast_cancer() X, y = data.data, data.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 定义模型参数 params = {'objective': 'binary:logistic', 'eval_metric': 'logloss'} # 训练模型 num_rounds = 100 dtrain = xgb.DMatrix(X_train, label=y_train) bst = xgb.train(params, dtrain, num_rounds) # 进行预测 dtest = xgb.DMatrix(X_test) preds = bst.predict(dtest) # 输出预测结果 predictions = [round(value) for value in preds] accuracy = accuracy_score(y_test, predictions) print("Accuracy: %.2f%%" % (accuracy * 100.0)) ``` 解释一下代码： 1. 首先导入XGBoost库、sklearn库中的load_breast_cancer、train_test_split和accuracy_score函数。 2. 使用load_breast_cancer函数加载乳腺癌数据集，这是一个二分类问题。 3. 使用train_test_split函数将数据集划分为训练集和测试集，其中测试集占比为20%。 4. 定义模型参数，这里使用了二分类任务的目标函数和评估指标。 5. 使用训练数据和模型参数训练模型，其中将训练数据和标签转换为DMatrix格式。 6. 准备测试数据，这里使用测试集数据进行预测，同样需要将测试数据转换为DMatrix格式。 7. 使用训练好的模型对测试数据进行预测。 8. 输出预测结果，并使用accuracy_score函数计算模型的准确率，以评估模型的预测效果。需要注意的是，sklearn中的XGBoost使用方法与原生的XGBoost库略有不同，但是由于使用了sklearn的接口，因此在使用过程中可以充分利用sklearn的其他功能，比如GridSearchCV进行参数调优等。