sklearn中predict()与predict_proba()用法区别

最新推荐文章于 2024-05-13 17:33:51 发布

LK2W

最新推荐文章于 2024-05-13 17:33:51 发布

阅读量5.2k

点赞数 5

分类专栏： Python学习文章标签： python

原文链接：https://www.cnblogs.com/mrtop/p/10309083.html

版权

Python学习专栏收录该内容

17 篇文章 4 订阅

订阅专栏

sklearn中predict()与predict_proba()用法区别

学习使用，侵权联系速删
转载：https://www.cnblogs.com/mrtop/p/10309083.html

predict：返回的是一个大小为n的一维数组，一维数组中的第i个值为模型预测第i个预测样本的标签；

predict_proba：返回的是一个n行k列的数组，第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率，此时每一行的和应该等于1。

# conding :utf-8 
 
from sklearn.linear_model import LogisticRegression 
import numpy as np 
x_train = np.array([[1,2,3], 
                    [1,3,4], 
                    [2,1,2], 
                    [4,5,6], 
                    [3,5,3], 
                    [1,7,2]]) 
   
y_train = np.array([3, 3, 3, 2, 2, 2]) 
   
x_test = np.array([[2,2,2], 
                   [3,2,6], 
                   [1,7,4]]) 
   
clf = LogisticRegression() 
clf.fit(x_train, y_train) 
   
# 返回预测标签 
print(clf.predict(x_test)) 
# [2 3 2] 
 
  
 
# 返回预测属于某标签的概率 
print(clf.predict_proba(x_test)) 
# [[0.56651809 0.43348191] 
#  [0.15598162 0.84401838] 
#  [0.86852502 0.13147498]] 
# 分析结果： 
# 预测[2,2,2]的标签是2的概率为0.56651809，3的概率为0.43348191 
# 预测[3,2,6]的标签是2的概率为0.15598162，3的概率为0.84401838 
# 预测[1,7,4]的标签是2的概率为0.86852502，3的概率为0.13147498

重点是求auc时，我们必须用predict_proba。因为roc曲线的阀值是根据其正样本的概率求的。

pre_test=model.predict_proba(x_test)
roc_auc_score(x_test,pre_test[:,1])

LK2W

关注

5
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
sklearn中predict()与predict_proba()用法区别

sklearn中predict()与predict_proba()用法区别学习使用，侵权联系速删转载：https://www.cnblogs.com/mrtop/p/10309083.htmlpredict是训练后返回预测结果，是标签值。predict_proba返回的是一个 n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。# conding :utf-8 from sklearn.linear_model imp
复制链接

扫一扫

专栏目录