最近参加了一个机器学习比赛,里面的评价函数比较特别,是这样的:
其实也并不特别,就是在均方误差(MSE)的基础上再乘了一个0.5
但是众所周知,XGBoost中的评价函数(eval_metric)只提供了一下几种选值:
rmse 均方根误差
mae 平均绝对误差
logloss 负对数似然函数值
error 二分类错误率
merror 多分类错误率
mlogloss 多分类logloss损失函数
auc 曲线下面积
所以,为了在XGBoost训练时能够能准确,只能自己定义一个评价函数了:
def myFeval(preds, xgbtrain):
label = xgbtrain.get_label()
score = mean_squared_error(label,preds)*0.5
return 'myFeval',score
这个函数有两个输入,需要注意的是第二个输入xgbtrain,这个输入是和你定义的xgb的训练集的命名有关的,我在这里的命名是这样的:
xgbtrain = xgb.DMatrix(X_train,y_train)
所以,我的函数的第二个输入是xgbtrain
然后函数返回两个值,一个是这个评价函数的名字,是一个字符串形式,另一个就是你自己定的评价函数的值。函数自定义完毕之后如何应用呢?
model = xgb.train(params, xgbtrain, num_rounds, watchlist, early_stopping_rounds=25,feval = myFeval)
在xgb.train中加上一个参数feval = myFeval就ok了
最后的运行结果:
参考网址:
http://blog.csdn.net/lujiandong1/article/details/52791117