最近用xgboost做了个识别二维码的任务(仅仅是识别是或不是,并不解析二维码的内容)。这里记录一下xgboost的使用,免得将来忘记。其实个人感觉xgboost真的是一个很强大的工具,在很多数据挖掘比赛里xgboost受到了众多选手的青睐,因为又快又简单而且不粘人。
首先是训练数据的准备。
#这里是从硬盘里读取训练数据生成数据框赋给data变量
data = read.csv('/Users/coyte/go/src/qrpie/train_data.csv')
#然后是准备训练数据,R的很多模型和包是可以直接用数据框训练的,但是xgboost比较例外,
需要先转化为矩阵才可以,我这里列名y是标签数据,这里x是特征,y是标签
x = model.matrix(y~.,data)[,-1]
y = data$y
#当然你可能需要一部分数据来进行训练,一部分