predict 和 predict_proba的概念
1、predict和predict_proba都是用于模型的预测。
2、predict返回的是一个预测的值,predict_proba返回的是对于预测为各个类别的概率。
3、predict_proba返回的是一个 n 行 k 列的数组,n 表示测试集中样本的个数, 第 i 行 j列的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。
实例
sklearn_predict = sklearn_logistic.predict(x_test)
print("*"*40)
print(sklearn_predict)
print("*"*40)
print(sklearn_logistic.predict_proba(x_test))
print("*"*40)
执行结果如下
****************************************
[1 0 0 ... 0 0 1]
****************************************
[[0.46000864 0.53999136]
[0.94667274 0.05332726]
[0.91604754 0.08395246]
...
[0.93297366 0.06702634]
[0.80933229 0.19066771]
[0.05448344 0.94551656]]
****************************************
上图则是通过predict_proba方法对test_x进行预测,返回值为array数组,其中每行都代表一个样本,第一个值表示预测为0的概率,第二个值表示预测为1的概率,并且每行的概率值之和都为1。