ROC 曲线 & AUC
横坐标为假正,纵坐标为真正
越接近1越好,(0,0)表示都预测成负,(1,1)表示都预测成正
而FPR(False Positive Rate)= FP /(FP + TN),即负类数据被分为正类的比例
TPR(True Positive Rate)= TP /(TP + FN),即正类数据被分为正类的比例
AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。 又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。 AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。
GMM 高斯混合模型
k 个高斯分布拟合样本分布,加权得到结果
EM算法:
xgboost
xgboost
boost算法,先用一个树预测,然后再取树对残差做拟合:
去掉常数后:
评分:
Gj :叶子结点 j 所包含样本的一阶偏导数累加之和,是一个常量;
Hj :叶子结点 j 所包含样本的二阶偏导数累加之和,是一个常量;