sklearn中predict与predict_proba区别

最新推荐文章于 2022-10-12 17:42:15 发布

GitzLiu

最新推荐文章于 2022-10-12 17:42:15 发布

阅读量3.9k

点赞数

分类专栏：机器学习文章标签： sklearn python predict

本文链接：https://blog.csdn.net/GitzLiu/article/details/81952431

版权

机器学习专栏收录该内容

17 篇文章 6 订阅

订阅专栏

predict_proba 返回的是一个 n 行 k 列的数组，列是标签（有排序）， 第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。

predict 直接返回的是预测的标签。

具体见下面示例：

# conding :utf-8  
from sklearn.linear_model import LogisticRegression  
import numpy as np  
x_train = np.array([[1,2,3],  
                    [1,3,4],  
                    [2,1,2],  
                    [4,5,6],  
                    [3,5,3],  
                    [1,7,2]])  
  
y_train = np.array([3, 3, 3, 2, 2, 2])  
  
x_test = np.array([[2,2,2],  
                   [3,2,6],  
                   [1,7,4]])  
  
clf = LogisticRegression()  
clf.fit(x_train, y_train)  
  
# 返回预测标签  
print(clf.predict(x_test))  
  
# 返回预测属于某标签的概率  
print(clf.predict_proba(x_test))  
  
# [2 3 2]  
#
# [[0.56651809 0.43348191]  
#  [0.15598162 0.84401838]  
#  [0.86852502 0.13147498]]  
# 分析结果：  
# 标签是 2，3 共两个，所以predict_proba返回的为2列，且是排序的（第一列为标签2，第二列为标签3），
# 返回矩阵的行数是测试样本个数 因此为3行
# 预测[2,2,2]的标签是2的概率为0.56651809，3的概率为0.43348191  
#  
# 预测[3,2,6]的标签是2的概率为0.15598162，3的概率为0.84401838  
#  
# 预测[1,7,4]的标签是2的概率为0.86852502，3的概率为0.13147498

GitzLiu

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
sklearn中predict与predict_proba区别

predict_proba 返回的是一个 n 行 k 列的数组，列是标签（有排序），第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。predict 直接返回的是预测的标签。具体见下面示例：# conding :utf-8 from sklearn.linear_model import LogisticRegression...
复制链接

扫一扫