下面将介绍XGBoost的python模块
编译及导入python模块
数据接口a参数置
训练模型
提前终止程序
预测
安装
首先安装xgboost的c++版本,然后进入原文件的根目录下的wrapper文件夹执行如下脚本安装python模块
python setup.py install
安装完成后按照如下方式导入xgboost的python模块
import xgboost as xgb
数据接口
xgboost可以加载libsvm格式的文本数据,加载的数据格式可以为NumPy的二维数组和xgboost的二进制缓存文件。加载的存储点在对象DMatrix中。
加载libsvm格式的数据和二进制的缓存文件时候可以使用如下方式
drain=xgb.Dmatrix('train.svm.txt') dtest=xgb.DMatrix('test.svm.buffer')
加载numpy的数组到Dmatrix对象时,可以用如下方式
data=np.random.rand(5,10) #5 entities,each contains 10 feature label =np.random.randint(2,size=5)#binary target dtrain=xgb.DMatrix(data,label=label)
将scipy.sparse格式的数据转化为DMatrix格式时,可以使用如下方式
csr=scipy.sparse.csr_matrix((dat,(row,col)),) drain =xgb.DMatrix(csr)
将DMatrix格式的数据保存为xgboost的二进制格式&#