LogisticRegression.predict_proba函数究竟返回什么?
在我的示例中,我得到这样的结果:
[[ 4.65761066e-03 9.95342389e-01]
[ 9.75851270e-01 2.41487300e-02]
[ 9.99983374e-01 1.66258341e-05]]
根据其他计算,使用S形函数,我知道第二列是概率。 documentation说,第一列是n_samples,但是不能,因为我的示例是评论,是文本而不是数字。该文档还说,第二列是n_classes。那肯定不是,因为我只有两个类(即+1和-1),并且该函数应该用于计算实际上属于某个类的样本的概率,而不是有关类本身的概率。
第一列到底是什么?为什么在那?
参考方案
4.65761066e-03 + 9.95342389e-01 = 1
9.75851270e-01 + 2.41487300e-02 = 1
9.99983374e-01 + 1.66258341e-05 = 1
第一列是条目具有-1标签的概率,第二列是条目具有+1标签的概率。请注意,类的顺序与self.classes_中的顺序相同。
如果您只想获取肯定标签的预测概率,则可以使用logistic_model.predict_proba(data)[:,1]。这将产生[9.95342389e-01, 2.41487300e-02, 1.66258341e-05]结果。
Python-scikit_learn中的克里金(高斯过程) - python
我正在考虑使用此方法对我拥有的3D点进