如何区分model.predict() 和 model.predict_proba()？

最新推荐文章于 2024-02-24 11:14:01 发布

XF鸭

最新推荐文章于 2024-02-24 11:14:01 发布

阅读量828

点赞数 3

分类专栏：深度学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_48690722/article/details/134715068

版权

深度学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

最近在做关于机器学习和深度学习实验的时候，直接将机器学习模型套了深度学习中，但出现了报错，下面我们来解释一下。

机器学习中：

def model_performance(model,X_train,y_train,X_test,y_test):
    model.fit(X_train, y_train)
    predicted = model.predict(X_test) # [0 0 0 ... 0 0 0]
    print("*****",predicted)
    predicted_prob = model.predict_proba(X_test) # 输出类别概率 5维度
    print(predicted_prob)

***** [0 0 0 ... 0 0 0]
[[0.0685155  0.22937195 0.39369586 0.20875027 0.09966642]
 [0.06768499 0.18204635 0.46509778 0.19814811 0.08702277]
 [0.06794315 0.19585645 0.42916814 0.20967341 0.09735886]
 ...
 [0.05866877 0.13941506 0.37418567 0.24062653 0.18710397]
 [0.05755057 0.16208819 0.4660596  0.21127041 0.10303124]
 [0.04571597 0.12904605 0.40106484 0.24679342 0.17737972]]

上面是他们输出的结果我们可以看出 model.predict 输出的是一个标签值，而第二个输出的是概率。

在机器学习中：

通常，机器学习中的模型输出是类别标签。例如，在二分类问题中，model.predict 可能返回类别标签 0 或 1。在多分类问题中，可能返回多个类别标签中的一个。
model.predict_proba 一般用于获取概率信息，返回每个类别的概率值。这在需要概率信息的场景中很有用，比如绘制 ROC 曲线、计算 AUC 等。

深度学习中：（model 中我们定义了一个MLP(多层感知机模型)）

def model_performance_DL(model,X_train,y_train,X_test,y_test):
    # model 已经在上面模型中fit了
    # y_pred = model.predict_proba(X_test)  #  [[0.11328121 0.15560272 0.41047114 0.21880718 0.10183779]...] 生成概率矩阵
    y_pred = model.predict(X_test)  #  [[0.11328121 0.15560272 0.41047114 0.21880718 0.10183779]...] 生成概率矩阵
    print(y_pred)
    predicted = []   # [2, 2, 2, 2, 2, 2,...]
    predicted_prob = y_pred
    for i in range(len(y_pred)):
        predicted.append(np.argmax(y_pred[i]))
    print(predicted)

[[0.0914833  0.16449034 0.36516902 0.21704283 0.1618145 ]
 [0.06984996 0.15207583 0.40046582 0.22811058 0.14949782]
 [0.06896283 0.15217893 0.4018344  0.22758484 0.14943895]
 ...
 [0.08319778 0.16089137 0.37650803 0.22180358 0.15759929]
 [0.06792274 0.15025833 0.40528333 0.22829781 0.14823778]
 [0.07095329 0.15256266 0.3989566  0.22734448 0.15018293]]


[[0.0914833  0.16449034 0.36516902 0.21704283 0.1618145 ]
 [0.06984996 0.15207583 0.40046582 0.22811058 0.14949782]
 [0.06896283 0.15217893 0.4018344  0.22758484 0.14943895]
 ...
 [0.08319778 0.16089137 0.37650803 0.22180358 0.15759929]
 [0.06792274 0.15025833 0.40528333 0.22829781 0.14823778]
 [0.07095329 0.15256266 0.3989566  0.22734448 0.15018293]]


[2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,

我们可以看出来两者输出的结果一样那说明他们在深度学习中往往直接输出多类别的概率

在深度学习中：

在深度学习中，model.predict 也可能输出类别标签，但更常见的是输出概率分布。即使是在分类任务中，深度学习模型一般会输出每个类别的概率分布。
model.predict_proba 在深度学习中可能被更直观地表示为 model.predict，因为深度学习模型常常直接输出类别概率，而不是硬性的类别标签。

总体而言，深度学习模型在输出时更倾向于提供类别的概率分布，这使得 model.predict 在深度学习中更类似于 model.predict_proba。在实际应用中，具体的输出形式取决于你的任务和模型的架构。

如果能够帮助你的话可以给个赞赞奖励一下谢谢！

XF鸭

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
如何区分model.predict() 和 model.predict_proba()？

最近在做关于机器学习和深度学习实验的时候，直接将机器学习模型套了深度学习中，但出现了报错，下面我们来解释一下。上面是他们输出的结果我们可以看出 model.predict 输出的是一个标签值，而第二个输出的是概率。我们可以看出来两者输出的结果一样那说明他们在深度学习中往往直接输出多类别的概率。总体而言，深度学习模型在输出时更倾向于提供类别的概率分布，这使得。在实际应用中，具体的输出形式取决于你的任务和模型的架构。深度学习模型一般会输出每个类别的概率分布。器学习中的模型输出是类别标签。
复制链接

扫一扫