Python 软件包介绍
本文档给出了有关 xgboost python 软件包的基本演练.
其他有用的链接列表
安装 XGBoost
要安装 XGBoost, 请执行以下步骤:
您需要在项目的根目录下运行 make 命令
在 python-package 目录下运行
python setup.py installimportxgboostasxgb
数据接口
XGBoost python 模块能够使用以下方式加载数据:
libsvm txt format file(libsvm 文本格式的文件)
Numpy 2D array, and(Numpy 2维数组, 以及)
xgboost binary buffer file. (xgboost 二进制缓冲文件)
这些数据将会被存在一个名为 DMatrix 的对象中.
要加载 ligbsvm 文本格式或者 XGBoost 二进制文件到 DMatrix 对象中. 代码如下:
dtrain=xgb.DMatrix('train.svm.txt')
dtest=xgb.DMatrix('test.svm.buffer')要加载 numpy 的数组到 DMatrix 对象中, 代码如下:
data=np.random.rand(5,10)# 5 entities, each contains 10 features
label=np.random.randint(2,size=5)# binary target
dtrain=xgb.DMatrix(data,label=label)要加载 scpiy.sparse 数组到 DMatrix 对象中, 代码如下:
csr=scipy.sparse.csr_matri