机器学习计算工具
zc02051126
这个作者很懒,什么都没留下…
展开
-
vw安装
Installation InstructionsCopyright (C) 1994, 1995, 1996, 1999, 2000, 2001, 2002, 2004, 2005, 2006 Free Software Foundation, Inc.This file is free documentation; the Free Software Foundation gives unl转载 2015-06-25 23:03:41 · 1096 阅读 · 0 评论 -
XGBoost:参数解释
XGBoost参数在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters:General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster有树模型(tree)和线性模型(linear model)。Booster parameters:这取翻译 2015-07-01 17:06:57 · 122445 阅读 · 5 评论 -
XGBoost:二分类问题
二分类问题本文介绍XGBoost的命令行使用方法。Python和R的使用方法见https://github.com/dmlc/xgboost/blob/master/doc/README.md 。 下面将介绍如何利用XGBoost解决二分类问题。以下使用的数据集见mushroom dataset 简介产生输入数据XGBoost的输入数据格式和LibSVM一样。下面是XGBoost使用的输入数据格翻译 2015-07-01 15:38:23 · 34503 阅读 · 2 评论 -
XGBoost:多分类问题
下面用数据 UCI Dermatology dataset演示XGBoost的多分类问题首先要安装好XGBoost的C++版本和相应的Python模块,然后执行如下脚本,如果本地没有训练所需要的数据,runexp.sh负责从https://archive.ics.uci.edu/ml/datasets/Dermatology下载数据集,然后调用train.pyRun runexp.sh./run翻译 2015-07-06 10:09:13 · 20976 阅读 · 2 评论 -
XGBoost:在Python中使用XGBoost
在Python中使用XGBoost下面将介绍XGBoost的Python模块,内容如下: * 编译及导入Python模块 * 数据接口 * 参数设置 * 训练模型l * 提前终止程序 * 预测A walk through python example for UCI Mushroom dataset is provided.安装首先安装XGBoost的C++版本,然后进入源文件的根目录下翻译 2015-07-06 11:27:44 · 132209 阅读 · 5 评论 -
VW输入文件格式
输入格式VW的输入数据每行表示一个样本,每个样本的格式必须如下 [Label] [Importance] [Tag]|Namespace Features |Namespace Features … |Namespace Features其中Namespace和Features的赋值形式如下 Namespace=String[:Value] Features=(String[:Value]翻译 2015-07-22 17:39:35 · 2575 阅读 · 0 评论 -
VW命令行参数
训练训练模型时最简单的命令如下 vw train_file –cache_file cache_train -f model_filetrain_file:训练数据,其格式见http://blog.csdn.net/zc02051126/article/details/47005229或者https://github.com/JohnLangford/vowpal_wabbit/wiki/Inp翻译 2015-07-23 17:20:39 · 1846 阅读 · 0 评论 -
VW源码阅读笔记
global_data.hstruct vw{ shared_data* sd; parser* p;#ifndef _WIN32 pthread_t parse_thread;#else HANDLE parse_thread;#endif AllReduceType all_reduce_type; AllReduce* all_reduce; LEARNER::b原创 2016-03-10 17:01:33 · 624 阅读 · 0 评论 -
Xgboost C++预测模块线程安全修复
1 背景Xgboost在各种排序场景中有广泛的应用,离线训练一般在Spark平台或者单机环境执行。训练好的模型用到线上预测时一般要根据自己的环境重新开发预测代码,例如,如果时Java环境,则需要用Java开发预测代码。主要原因是Xgboost提供的预测模块不支持多线程,本文介绍如何修改C++代码,使其符合线上预测要求。下面将根据实际探索过程逐步介绍如何将xgboost4j的Java接口修改成符...原创 2018-03-03 00:04:37 · 4836 阅读 · 15 评论