学习笔记-3-SVM-5-Approximate LSVM

Wooden_ZHANG

于 2022-12-07 06:16:01 发布

阅读量275

点赞数

分类专栏：数据科学文章标签：学习

本文链接：https://blog.csdn.net/shuzhu024/article/details/128213633

版权

数据科学专栏收录该内容

10 篇文章 0 订阅

订阅专栏

细节内容请关注微信公众号：运筹优化与数据科学

ID: pomelo_tree_opt

Outline

1. Linear separable?

2. Approximate LSVM - basic idea

3. Piecewise-linear minimization

4. Approximate LSVM implication

5. Approximate LSVM considering generalizability

----------------------------

1. Linear separable?

Linearly separable?

How do we know a given dataset is linearly separable?
How difficult to check the linear separability

--------------------------------

前面的例子，都是hard margin的例子，是对一堆数据直接解primal or dual LSVM.

现在的问题是给了一堆数据之后，我们并不知道是否是线性可分的。

二维的还可以勉强观察一下，三维的基本上就看不出来了，更高维的更没戏。

----------------------------

问题是我们怎么判断给定的这一堆数据是否是线性可分的？

第一个思路就是，不管是不是线性可分的，直接丢到solver里，去解primal or dual LSVM, 看看是不是feasible.

如果feasible, 就是线性可分的，而且直接得到了分割超平面。
如果不是线性可分的，就是infeasible, 压根解不出来。

注意这是通过解一个quadratic programming来判断是否是线性可分。

那么有没有更简单的方式来判断究竟是不是linearly separable呢？

---------------------------

再进一步，所以可以有个penalty function, 来惩罚那些违反约束的点。

=========================

2. Approximate LSVM - basic idea

注意，max的部分才是penalty.

如果违反了约束就罚，就是1-y_i(a^T x^i + b)的部分
如果没违反，就不罚，也即是罚0.

然后把所有的violation加起来，就是sum的部分，然后去minimize这个sum的东西。

最终是找到合适的a和b，使得total violation越小越好。

----------------------------------

这就是approximate linear separation.

我们还是在找a和b，找到了a和b，就找到了一个hyperplane.

这个就叫做approximation LSVM.

----------------------------------

而且这个问题的特点是，这个问题永远都是feasible的，因为压根没有任何restriction，也就是没有约束条件。一定会得到a和b. 与之前的primal LSVM或dual LSVM相比，这两个如果丢给solver，很可能是infeasible的。

如果obj=0, 意味着能顺利找到一个分割超平面，e.g. H2与H3，意味着真的是linear separable, 而且是真的给了个supporting hyperplane, 至于这个supporting hyperplane有多好是另外一码事，比如这里给的H2，而primal LSVM给的是H3.
如果obj不为0，说明是线性不可分的，至少有一个点violation. 但是这也能给我一个a和b，告诉我们这个a和b构造的分割超平面已经是不错了。

----------------------------------

这个function有时候叫做hinge-error function，就是强调这个hyperplane是approximate的，会有些点在超平面附近错落摆放，所以是hinge. 只是个名词而已。

----------------------------------

A piecewise-linear minimization problem with variables a, b.