机器学习之模型评估（还是没搞定...）

最新推荐文章于 2023-03-13 23:08:39 发布

SsunTtaoauto

最新推荐文章于 2023-03-13 23:08:39 发布

阅读量811

点赞数

文章标签： sklear

本文链接：https://blog.csdn.net/qq_30006749/article/details/84326200

版权

在尝试评估包括逻辑回归、lightgbm和XGBoost在内的五个模型时，遇到了绘制ROC曲线为空白、lightgbm分类错误以及XGBoost警告等问题。针对lightgbm的错误，发现模型输出是概率而非标签。逻辑回归问题通过调用predict而不是predict_proba解决。总结中表达了对团队合作和正确代码参考的需求。

摘要由CSDN通过智能技术生成

任务介绍
1.任务：预测贷款用户是否会逾期
2.status是标签：0表示未逾期，1表示逾期

【任务四：模型评估】记录五个模型关于precision，rescore，f1，auc，roc的评分表格，画出auc和roc曲线图。

模型	`Precesion`	`Recall`	`F1-score`	`AUC`	`ACC`
逻辑回归	0.4500	0.0244	0.0463	0.5070	0.7400
SVM	0.500	0.0081	0.0160	0.5026	0.7414
决策树	0.3056	0.3388	0.3213	0.5352	0.6300
XGBoost	0.3707	0.5000	0.4258	0.5000	0.7414
lightgbm				0.5981

这个任务持续做了两天也没有搞定，一开始还以为挺简单，没想到一直搞不出来。两个大的问题：

1.绘制ROC曲线的图一直为空白，这是5个模型都存在的问题。

2.lightgbm模型在评估上一直报错：ValueError: Classification metrics can't handle a mix of binary and continuous targets

模型的预测输出确实有问题，不是标签1 和0，而是概率，这个确实是问题，但查了好久也没解决。

3.XGBoost模型那是一直有个警告：UndefinedMetricWarning: F-score is ill-defined and being set to 0.0 in labels with no predicted samples.

已解决的问题：

1.逻辑回归模型那里本来也是出现lightgbm同样的报错，经过查询发现是预测那一步调用的函数有问题，应该调用predict就没问题了，我一开始是用predict_proba函数，这两者的区别为：

predict_proba返回的是一个n行k列的数组，第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。此时每一行的和应该等于1。

predict返回的是一个大小为n的一维数组，一维数组中的第i个值为模型预测第i个预测样本的标签；

总结：自己独立解决问题的能力还是不行，有个能讨论的团队还是好很多，这样的学习模式确实挺好，如果每次任务完成能给出正确代码就好了，问题也能对照解决。

SsunTtaoauto

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫