predict_proba和prdict的不同和适用

最新推荐文章于 2023-06-14 22:31:21 发布

sorrythanku

最新推荐文章于 2023-06-14 22:31:21 发布

阅读量2.3k

点赞数 2

分类专栏：机器学习文章标签：模型参数

本文链接：https://blog.csdn.net/starmoth/article/details/84963525

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

predict：
返回的是一个大小为n的一维数组，一维数组中的第i个值为模型预测第i个预测样本的标签；

predict_proba：
返回的是一个n行k列的数组，第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率，此时每一行的和应该等于1。

from sklearn.linear_model import LogisticRegression

 from sklearn.linear_model import LogisticRegression
  import numpy as np
   x_train = np.array([[1,2,3],[1,3,4],[2,1,2],[4,5,6],[3,5,3],[1,7,2]])

 y_train = np.array([0, 0, 0, 1, 1, 1])

 x_test = np.array([[2,2,2],[3,2,6],[1,7,4]])

clf = LogisticRegression()

 clf.fit(x_train, y_train)

#返回预测标签

 clf.predict(x_test)

    array([1, 0, 1])

#返回预测属于某标签的概率

clf.predict_proba(x_test)

    array([[ 0.43348191, 0.56651809],[ 0.84401838, 0.15598162],[ 0.13147498, 0.86852502]])

这里我想说的重点是求auc时，我们必须用predict_proba。因为roc曲线的阀值是根据其正样本的概率求的。所以应该是

pre_test=model.predict_proba(x_test)
roc_auc_score(x_test,pre_test[:,1])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sorrythanku

关注关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Sklearn XGBoost模型算法分类建模-----风控项目实战（PR曲线、KS、AUC、F1-Score各类指标）

weixin_41025946的博客

12-21

3453

XGBOOST分类模型，风控建模实战，F1-SCORE、KS、PR曲线、AUC等详细代码图解

逻辑回归（Logistic回归）

qq_32733847的博客

10-21

2368

逻辑回归 Logit函数 h(x)被称为logistic回归模型将线性回归模型的预测值经过非线性的logistic函数转换为（0,1]之间的概率值，因变量取1和0的条件概率分别用h（x）和1-h（x）表示将logistic回归模型还原成线性回归：优势odds，发生比概率值是关于h（X）的函数，即事件发生的概率函数，当某个事件发生时，y=1，h（X） 1.最大似然估计为了求解\...

5 条评论您还未登录，请先登录后发表或查看评论

浅谈sklearn中predict与predict_proba区别

09-16

主要介绍了浅谈sklearn中predict与predict_proba区别，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

predict_proba

Du_Shuang的博客

11-16

1352

转载于：https://blog.csdn.net/m0_37870649/article/details/79549142 predict_proba返回的是一个 n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。 # conding :utf-8 from sklearn.linear_model import L...

predict_proba函数 Python

weixin_44056948的博客

06-03

1万+

predict_proba返回的是一个 n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。 # conding :utf-8 from sklearn.linear_model import LogisticRegression import numpy as np x_train = np.array([[1,2,3], [1,3,4], ...

python sklearn教程_sklearn的predict_proba使用说明

weixin_39603217的博客

11-26

816

发现个很有用的方法——predict_proba今天在做数据预测的时候用到了，感觉很不错，所以记录分享一下，以后可能会经常用到。我的理解：predict_proba不同于predict，它返回的预测值为，获得所有结果的概率。（有多少个分类结果，每行就有多少个概率，以至于它对每个结果都有一个可能，如0、1就有两个概率）举例：获取数据及预测代码：from sklearn.linear_model im...

sklearn的predict_proba

昆兰.沃斯的博客

05-22

1万+

发现个很有用的方法——predict_proba 今天在做数据预测的时候用到了，感觉很不错，所以记录分享一下，以后可能会经常用到。我的理解：predict_proba不同于predict，它返回的预测值为，获得所有结果的概率。（有多少个分类结果，每行就有多少个概率，以至于它对每个结果都有一个可能，如0、1就有两个概率）举例：获取数据及预测代码： from sklearn.line...

PYTHON用户流失数据挖掘：建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像...

拓端研究室TRL

03-13

536

原文链接：http://tecdat.cn/?p=24346在今天产品高度同质化的品牌营销阶段，企业与企业之间的竞争集中地体现在对客户的争夺上（点击文末“阅读原文”获取完整代码数据）。“用户就是上帝”促使众多的企业不惜代价去争夺尽可能多的客户。但是企业在不惜代价发展新用户的过程中，往往会忽视或无暇顾及已有客户的流失情况，结果就导致出现这样一种窘况：一边是新客户在源源不断地增加，而另一方面是辛辛苦苦...

predict_proba 的使用

weixin_33885253的博客

01-21

232

转载于:https://www.cnblogs.com/zhangbo2008/p/8322459.html

Sklearn中predict_proba函数用法及原理详解

weixin_45804601的博客

10-12

4685

Sklearn中predict_proba函数用法及数学原理详解（以logistic回归为例）

Keras构建神经网络踩坑(解决model.predict预测值全为0.0的问题)

09-16

主要介绍了Keras构建神经网络踩坑(解决model.predict预测值全为0.0的问题)，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

sklearn中predict_proba、predict用法

dream6104的专栏

04-11

3万+

总的来说，predict返回的是一个预测的值，predict_proba返回的是对于预测为各个类别的概率。predict_proba返回的是一个n 行 k 列的数组，第 i行j列的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。 predict import numpy as np X = np.array([[-1, -1], [-2, -1], ...

python predict_proba_sklearn中predict_proba的用法例子(转)

weixin_39976575的博客

12-09

290

predict_proba返回的是一个n行k列的数组，第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。所以每一行的和应该等于1.举个例子>>> from sklearn.linear_model import LogisticRegression>>> import numpy as np>>> x_train = np.arra...

机器学习_预测概率校准

大道至简

06-14

2925

我们在建模时通常根据准确性或准确性来评估其预测模型，但几乎不会问自己：“我的模型能够预测实际概率吗？但是，从商业的角度来看，准确的概率估计是非常有价值的（准确的概率估计有时甚至比好的精度更有价值）。来看一个例子。AB两个模型的AUC一样。但是根据模型A，你可以通过推荐普通马克杯来最大化预期的利润，然而根据模型B，小猫马克杯可以最大化预期的利润。在像这样的现实应用中，搞清楚哪种模型能够估算出更好的概率是至关重要的事情。

sklearn中predict_proba用法（注意和predict的区别）

热门推荐

飘过的春风

03-03

7万+

“无意中发现了一个巨牛的人工智能教程，忍不住分享一下给大家。教程不仅是零基础，通俗易懂，而且非常风趣幽默，像看小说一样！觉得太牛了，所以分享给大家。点这里可以跳转到教程。” predict_proba返回的是一个n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。 # conding :utf-8 fr...

scikit-learn工具包中分类模型predict_proba、predict、decision_function用法详解

胖胖大海的博客

06-13

4万+

在使用sklearn训练完分类模型后，下一步就是要验证一下模型的预测结果，对于分类模型，sklearn中通常提供了predict_proba、predict、decision_function三种方法来展示模型对于输入样本的评判结果。说明一下，在sklearn中，对于训练好的分类模型，模型都有一个classes_属性，classes_属性中按顺序保存着训练样本的类别标记。下面是使用Logistic Regression分类器在为例，展示一下分类器的classes_属性。 1、先看一下样本标签从0...

python predict_proba_sklearn的predict_proba使用说明

weixin_39949889的博客

12-09

1142

发现个很有用的方法——predict_proba今天在做数据预测的时候用到了，感觉很不错，所以记录分享一下，以后可能会经常用到。我的理解：predict_proba不同于predict，它返回的预测值为，获得所有结果的概率。(有多少个分类结果，每行就有多少个概率，以至于它对每个结果都有一个可能，如0、1就有两个概率)举例：获取数据及预测代码：训练数据训练结果，与训练数据一一对应：[1 1 1 0 ...

关于对随机森林接口predict_proba()的个人理解

m0_47505062的博客

08-21

1685

关于随机森林接口 predict_proba 的个人理解

sklearn 中 predict 方法和 predict_proba 方法的区别和使用

qq_43468807的博客

04-24

1万+

一、predict 和 predict_proba的概念和区别 1、predict和predict_proba都是用于模型的预测。 2、predict返回的是一个预测的值，predict_proba返回的是对于预测为各个类别的概率。 3、predict_proba返回的是一个 n 行 k 列的数组，n 表示测试集中样本的个数，第 i 行 j列的数值是模型预测第 i 个预...

clf_train_proba = clf.predict_proba((x_train)[:, 1],probability=True) clf_test_proba = clf.predict_proba((x_test)[:, 1],probability=True)predict_proba is not available when probability=False报错