在这个问题上,我引用了以下代码:>>> import sklearn
>>> sklearn.__version__
'0.13.1'
>>> from sklearn import svm
>>> model = svm.SVC(probability=True)
>>> X = [[1,2,3], [2,3,4]] # feature vectors
>>> Y = ['apple', 'orange'] # classes
>>> model.fit(X, Y)
>>> model.predict_proba([1,2,3])
array([[ 0.39097541, 0.60902459]])
我在那个问题中发现这个结果代表了属于每个类的点的概率,按照model.classes给出的顺序>>> zip(model.classes_, model.predict_proba([1,2,3])[0])
[('apple', 0.39097541289393828), ('orange', 0.60902458710606167)]
所以。。。这个答案,如果解释正确的话,可能是一个‘橙色’(由于数据量很小,可信度相当低)。但直觉上,这个结果显然是错误的,因为给出的点与“苹果”的训练数据是相同的。为了确定,我也测试了反面:>>> zip(model.classes_, model.predict_proba([2,3,4])[0])
[(