发现个很有用的方法——predict_proba
今天在做数据预测的时候用到了,感觉很不错,所以记录分享一下,以后可能会经常用到。
我的理解:predict_proba不同于predict,它返回的预测值为,获得所有结果的概率。(有多少个分类结果,每行就有多少个概率,以至于它对每个结果都有一个可能,如0、1就有两个概率)
举例:
获取数据及预测代码:
from sklearn.linear_model import LogisticRegression
import numpy as np
train_X = np.array(np.random.randint(0,10,size=30).reshape(10,3))
train_y = np.array(np.random.randint(0,2,size=10))
test_X = np.array(np.random.randint(0,10,size=12).reshape(4,3))
model = LogisticRegression()
model.fit(train_X,train_y)
test_y = model.predict_proba(test_X)
print(train_X)
print(train_y)
print(test_y)
训练数据
[[2 9 8]
[0 8 5]
[7 1 2]
[8 4 6]
[8 8 3]
[7 2 7]
[6 4 3]
[1 4 4]