【译】Windows下安装XGBoost

XGBoost是Gradient Boosting算法的一种高级实现,在Kaggle competitions上崭露头角。下面就对XGBoost在Windows上的安装作一个介绍,因为XGBoost在Windows平台上的安装不是那么简单直接。我在实验室的电脑上(Windows 7,64 bits)通过这些步骤安装成功,希望能对后来人有所帮助。

安装必要的软件

为了能在Windows上通过Python使用XGBoost,需要先安装以下三个软件:
* Python
* Git
* MINGW

Python和Git的安装

对于Python,你可以到Python官网上下载你想安装的版本,安装很简单,这里就跳过。对于Git的安装有很多种选择,一种选择就是使用Git for Windows,Git for Windows的安装也比较简单,遵从指示就行,这里也跳过。

XGBoost的下载

Git安装完成后,开始菜单中会出现一个叫Git Bash的程序,点开后就会出现一个类似Windows命令行的窗口,首先在这个Bash窗口,使用cd命令进入你想保存XGBoost代码的文件夹,比如下面的示例:

$ cd /e/algorithm

然后输入下面的代码下载XGBoost文件包:

$ git clone --recursive https://github.com/dmlc/xgboost
$ cd xgboost
$ git submodule init
$ git submodule update

编译XGBoost代码

MinGW-W64的安装

接下来就是编译我们刚刚下载的XGBoost的代码。这就需要用到MinGW-W64。它的安装包我是从这里下载的,下载完成后双击安装,出现下面的安装界面,点击Next:
mingw install screenshot_1

然后在Architecture选项处选择x86_64即可,其他选项保持默认,如下图:
mingw install screenshot2

然后点击下一步,就能安装完成。我使用的是默认安装路径C:\Program Files\mingw-w64\x86_64-6.3.0-posix-seh-rt_v5-rev1。那么make命令和运行库就在下面的文件夹中(也就是包含mingw32-make的文件夹):C:\Program Files\mingw-w64\x86_64-6.3.0-posix-seh-rt_v5-rev1\mingw64\bin,接下来就是把上面的路径添加到系统的Path中,关于如何添加环境变量到系统的Path中,可以参考这篇文章

上面的步骤完成后,关闭Git Bash窗口后重新打开,为了确认添加环境变量已经添加成功,可以在Bash中键入下面的命令:

$ which mingw32-make

如果添加成功的话,应该返回类似下面这样的信息:

C:\Program Files\mingw-w64\x86_64-6.3.0-posix-seh-rt_v5-rev1\mingw64\bin\mingw32-make

为了输入的方便,可以简化mingw32-make命令为make

$ alias make='mingw32-make'

XGBoost的编译

现在就可以开始编译XGBoost了,首先进入xgboost文件夹

$ cd /e/algorithm/xgboost

通过这篇官方文档给出的统一编译的方法在写这篇文章时还不能正常编译成功,所以我们采用下面的命令来分开编译,每次编译一个子模块。注意,我们要等每个命令编译完成后才能键入下一个命令。

$ cd dmlc-core
$ make -j4
$ cd ../rabit
$ make lib/librabit_empty.a -j4
$ cd ..
$ cp make/mingw64.mk config.mk
$ make -j4

一旦最后一个命令完成后,整个编译过程就完成了。下面就开始安装Python模块。进入XGBoost文件夹下面的python-package子文件夹,然后键入:

$ cd /e/algorithm/xgboost/python-package>python setup.py install

进行到这儿,基本上就完成了,这时打开一个Jupyter notebook,直接导入xgboost包会出现错误,我们需要先运行下面的代码:

import os

mingw_path = 'C:\Program Files\mingw-w64\x86_64-6.3.0-posix-seh-rt_v5-rev1\mingw64\bin'

os.environ['PATH'] = mingw_path + ';' + os.environ['PATH']

成功示例

然后我们就可以开始导入xgboost包去运行下面的示例:

import xgboost as xgb
import numpy as np

data = np.random.rand(5,10) # 5 entities, each contains 10 features
label = np.random.randint(2, size=5) # binary target
dtrain = xgb.DMatrix( data, label=label)

dtest = dtrain

param = {'bst:max_depth':2, 'bst:eta':1, 'silent':1, 'objective':'binary:logistic' }
param['nthread'] = 4
param['eval_metric'] = 'auc'

evallist  = [(dtest,'eval'), (dtrain,'train')]

num_round = 10
bst = xgb.train( param, dtrain, num_round, evallist )

bst.dump_model('dump.raw.txt')

至此,如果没有出现错误,就表示安装成功。

参考

Jean Francois Puget: Installing XGBoost for Anaconda on Windows

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值