机器学习之SVM多分类

最新推荐文章于 2022-12-04 11:18:49 发布

@~~~~小飞

最新推荐文章于 2022-12-04 11:18:49 发布

阅读量956

点赞数 1

分类专栏：机器学习之SVM 文章标签：机器学习

原文链接：https://blog.csdn.net/xfchen2/article/details/79621396

版权

机器学习之SVM 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

以下内容参考：https://www.cnblogs.com/CheeseZH/p/5265959.html

                   http://blog.csdn.net/rainylove1/article/details/32101113

                  王正海《基于决策树多分类支持向量机岩性波谱分类》

SVM本身是应用于二分类的，所以在处理多分类并且想应用SVM有必要进行改进

1、SVM直接进行多分类

SVM如果直接在目标函数上进行修改的话，就是将多个分类面的参数合并到一个最优化问题上，显然难度太大。
但是对于lr的话，可以直接拓展为softmax多分类。

2、SVM多分类间接实现

常见的方法有两种 one vs one and one vs all

(1)one vs one

其中libsvm就是one vs one 实现的。k类的数据集中，单独为每两类的样本设计SVM，进行分类。最终必须设计k(k-1)/2个分类器，最终用投票的方式进行选择。这也是libsvm采用的方法，但是当类别有1000个的时候、、、
　当对一个未知样本进行分类时，最后得票最多的类别即为该未知样本的类别。

Libsvm中的多类分类就是根据这个方法实现的。

假设有四类A,B,C,D四类。在训练的时候我选择A,B; A,C; A,D; B,C; B,D;C,D所对应的向量作为训练集，然后得到六个训练结果，在测试的时候，把对应的向量分别对六个结果进行测试，然后采取投票形式，最后得到一组结果。

投票是这样的：
　　A=B=C=D=0;
　　(A,B)-classifier 如果是A win,则A=A+1;otherwise,B=B+1;
　　(A,C)-classifier 如果是A win,则A=A+1;otherwise, C=C+1;
　　…
　　(C,D)-classifier 如果是A win,则C=C+1;otherwise,D=D+1;
　　The decision is the Max(A,B,C,D)

评价：这种方法虽然好,但是当类别很多的时候,model的个数是n*(n-1)/2,代价还是相当大的。
在这里插入图片描述
直接方法尽管看起来简洁，但是在最优化问题求解过程中的变量远远多于第一类方法，训练速度不及间接方法，而且在分类精度上也不占优。当训练样本数非常大时，这一问题更加突出。正因如此，间接方法更为常用。

（2）one vs all

	某一类归为正类，其余全部是负类

假如我有四类要划分（也就是4个Label），他们是A、B、C、D。

于是我在抽取训练集的时候，分别抽取

（1）A所对应的向量作为正集，B，C，D所对应的向量作为负集；

（2）B所对应的向量作为正集，A，C，D所对应的向量作为负集；

（3）C所对应的向量作为正集，A，B，D所对应的向量作为负集；

（4）D所对应的向量作为正集，A，B，C所对应的向量作为负集；

使用这四个训练集分别进行训练，然后的得到四个训练结果文件。

在测试的时候，把对应的测试向量分别利用这四个训练结果文件进行测试。

最后每个测试都有一个结果f1(x),f2(x),f3(x),f4(x)。

于是最终的结果便是这四个值中最大的一个作为分类结果。
　
在这里插入图片描述

@~~~~小飞

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录