sklearn学习笔记（3）svm多分类

最新推荐文章于 2024-03-07 10:33:39 发布

BabyBirdToFly

最新推荐文章于 2024-03-07 10:33:39 发布

阅读量3.6w

点赞数 14

分类专栏：机器学习文章标签： svm

机器学习专栏收录该内容

4 篇文章 1 订阅

订阅专栏

SVC、NuSVC、LinearSVC都可以在一个数据集上实现多分类。
SVC和NuSVC方法类似，但是有不同的输入参数集和不同的数学表述。另一方面，linearSVC是SVC的在线性核的基础上的另一种实现，所以LinearSVC不能不能接受关键字“kernel”，只能是线性。
二分类
和别的分类器一样，三种分类器需要输入两个数组：X[n样本][n维特征]（训练数据集）Y[n个标签]（类标签）

from sklearn import svm
X = [[0，0], [1，1]]
Y = [0, 1]

模型学习之后可以进行预测：

clf = svm.SVC()
clf.fit(X,y)
clf.predict([[2.,2.]])

SVM的决策函数依赖于训练数据集的支持向量子集。这些属性可以通过下面函数进行查看

#get support vector
clf.support_vectors_
#get indices of support vectors
clf.support_
#get number of support vectors for each class
clf.n_support_

多分类
SVC和NuSVC实现“1v1“的方法进行多分类（Knerr et al，1990）。如果n_class是类别的数量，那么需要建立n*n/2个分类器，desision_function_shape选项允许集成“1v1”分类器来刻画（n_samples,n_features）

clf = svm.SVC(decision_function_shape='ovo')
clf.fit(X, Y)
dec = clf.decision_function([[1]])
print dec.shape[1] # 4 classes: 4*3/2 = 6
print clf.predict([[1]])

clf.decision_function_shape = "ovr"
dec = clf.decision_function([[1]])
print dec.shape[1]
print clf.predict([[2.4]])

同时，LinearSVC也实现了“one vs the rest”多分类策略。

lin_clf = svm.LinearSVC()
lin_clf.fit(X,Y)
dec = lin_clf.decision_function([[3]])
print dec.shape[1]
print lin_clf.predict(2.4)

评分和概率
SVC方法decision_function给每个样本中的每个类一个评分，当我们将probability设置为True之后，我们可以通过predict_proba和predict_log_proba可以对类别概率进行评估。
Wu, Lin and Weng, “Probability estimates for multi-class classification by pairwise coupling”, JMLR 5:975-1005, 2004.
不均衡问题
我们可以通过class_weight和sample_weight两个关键字实现对特定类别或者特定样本的权重调整。

BabyBirdToFly

关注

14
点赞
踩
57

收藏

觉得还不错? 一键收藏
0
评论
sklearn学习笔记（3）svm多分类

SVC、NuSVC、LinearSVC都可以在一个数据集上实现多分类。 SVC和NuSVC方法类似，但是有不同的输入参数集和不同的数学表述。另一方面，linearSVC是SVC的在线性核的基础上的另一种实现，所以LinearSVC不能不能接受关键字“kernel”，只能是线性。二分类和别的分类器一样，三种分类器需要输入两个数组：X[n样本][n维特征]（训练数据集）Y[n个标签]（类标签）
复制链接

扫一扫