机器学习入门-概率阈值的逻辑回归对准确度和召回率的影响 lr.predict_proba(获得预测样本的概率值)...

weixin_33813128

于 2019-01-15 12:42:00 发布

阅读量4.4k

点赞数

文章标签：数据结构与算法人工智能 python

原文链接：http://www.cnblogs.com/my-love-is-python/p/10271240.html

版权

本文介绍了在机器学习中，逻辑回归模型使用lr.predict_proba()方法获取样本预测概率值，并探讨了不同概率阈值如何影响预测结果的准确度和召回率。当阈值降低，被判为正例的数量增加，导致召回率上升但准确率下降。因此，选择合适的阈值至关重要，需要平衡两者以优化模型性能。

摘要由CSDN通过智能技术生成

1.lr.predict_proba(under_text_x) 获得的是正负的概率值

在sklearn逻辑回归的计算过程中，使用的是大于0.5的是正值，小于0.5的是负值，我们使用使用不同的概率结果判定来研究概率阈值对结果的影响

从图中我们可以看出，阈值越小，被判为正的越多，即大于阈值的就是为正，但是存在一个很明显的问题就是很多负的也被判为正值。

当阈值很小时，数据的召回率很大，但是整体数据的准确率很小

因此我们需要根据召回率和准确率的综合考虑选择一个合适的阈值

lr = LogisticRegression(C=best_c, penalty='l1')
lr.fit(under_train_x, under_train_y)

pred_array = np.array(lr.predict_proba(under_text_x))

thresholds = [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9

最低0.47元/天解锁文章

weixin_33813128

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
机器学习入门-概率阈值的逻辑回归对准确度和召回率的影响 lr.predict_proba(获得预测样本的概率值)...

1.lr.predict_proba(under_text_x) 获得的是正负的概率值在sklearn逻辑回归的计算过程中，使用的是大于0.5的是正值，小于0.5的是负值，我们使用使用不同的概率结果判定来研究概率阈值对结果的影响从图中我们可以看出，阈值越小，被判为正的越多，即大于阈值的就是为正，但是存在一个很明显的问题就是很多负的也被判为正值。当阈值很小时，数据的召回...
复制链接

扫一扫