lightgbm在作类别预测的时候,有一些不同的使用方法
import lightgbm as lgb
#第一种
estimator=lgb.sklearn.LGBMClassifier()
estimator.fit(x_train,y_train) #x_train和y_train 是numpy或pandas数据类型即可
pre = estimator.predict(x_test) #返回的是类别
#-----------------------------------------
#第二种
lgtrain = lgb.Dataset(X_train,label = y_train)
lgb.train(lgtrain) #此时的训练数据需要为 lgb的数据类型
pre = lgb.predict(x_test) #此时返回的是对每类的预测概率,需要自行转化为类
#假设训练数据有N个,类别为n个,则pre是一个N*n的np.array
y_test = np.argmax(pre,axis = 1) #转化为类别
#-------------------------------------
#在lgb.cv()中,得出的结果仍然是概率,但是这时是一个 Nn*1的np.array,此时转化方法如下
#概率转化为类别,num_class 为类别的种类
pre = np.argmax(pre.reshape(num_class, -1),axis=0)
#因此 如果需要自定义评价函数,也需要先自行转化
def evalerror(preds, lgtrain):
from sklearn.metrics import f1_score
import numpy as np
preds = np.argmax(preds.reshape(num_class, -1),axis=0)
label = lgtrain.get_label()
esult = f1_score(preds,label,average = 'macro')
return 'f1_score',result,True