有人说是样本数少导致的,不过我的测试集有1000个样本,也少吗?
查阅了官方文档,给出了答案。
网址:https://scikit-learn.org/dev/modules/svm.html#scores-and-probabilities
概率估计值可能与分数不一致:
-
分数的“ argmax”可能不是概率的argmax
-
在二元分类中,
predict
即使输出predict_proba
小于0.5,也可以将样本标记为属于阳性类别。同样,即使输出predict_proba
大于0.5 ,也可以将其标记为负。
众所周知,Platt的方法也存在理论问题。如果需要置信度得分,但不一定非要是概率,那么建议设置probability=False
并使用decision_function
代替predict_proba
。