python xgboost用法_XGBoost使用教程(纯xgboost方法)一

本文详细介绍了如何使用Python的XGBoost库进行机器学习,包括导入必要的工具包、数据读取(以libsvm格式为例)、训练参数设置、模型训练、模型评估,以及模型可视化的步骤。通过加载UCI蘑菇数据集,展示了训练二分类模型的过程,并计算了训练和测试集的准确率。
摘要由CSDN通过智能技术生成

一、导入必要的工具包

# 导入必要的工具包

import xgboost as xgb

# 计算分类正确率

from sklearn.metrics import accuracy_score

二、数据读取

XGBoost可以加载libsvm格式的文本数据,libsvm的文件格式(稀疏特征)如下:

1  101:1.2 102:0.03

0  1:2.1 10001:300 10002:400

...

每一行表示一个样本,第一行的开头的“1”是样本的标签。“101”和“102”为特征索引,'1.2'和'0.03' 为特征的值。

在两类分类中,用“1”表示正样本,用“0” 表示负样本。也支持[0,1]表示概率用来做标签,表示为正样本的概率。

下面的示例数据需要我们通过一些蘑菇的若干属性判断这个品种是否有毒。

UCI数据描述:http://archive.ics.uci.edu/ml/machine-learning-databases/mushroom/ ,

每个样本描述了蘑菇的22个属性,比如形状、气味等等(将22维原始特征用加工后变成了126维特征,

并存为libsvm格式),然后给出了这个蘑菇是否可食用。其中6513个样本做训练,1611个样本做测试。

注:libsvm格式文件说明如下 https://www.cnblogs.com/codingmengmeng/p/6254325.html

XGBoost加载的数据存储在对象DMatrix中

XGBoost自定义了一个数据矩阵类DMatrix,优化了存储和运算速度

DM

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值