SVM-1

最新推荐文章于 2019-08-18 17:40:04 发布

panddStephen

最新推荐文章于 2019-08-18 17:40:04 发布

阅读量164

点赞数

分类专栏：数据分析算法

本文链接：https://blog.csdn.net/weixin_42093798/article/details/99702621

版权

数据分析算法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1. 背景：

1.1 最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出

1.2 目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出，并在1995年发表

1.3 深度学习（2012）出现之前，SVM被认为机器学习中近十几年来最成功，表现最好的算法

2. 机器学习的一般框架：

训练集 => 提取特征向量 => 结合一定的算法（分类器：比如决策树，KNN）=>得到结果

3. 介绍：

3.1 例子：

寻找超平面
两类？哪条线最好？

3.2 SVM寻找区分两类的超平面（hyper plane), 使边际(margin)最大

边际（margin）最大：超平面（hyper plane）(图示中那条线)到两边最近的点之间的距离之和最大。
为什么margin大好：当我们给一些新的点的时候，它区分犯错的几率比较小。（基本的动机）
总共可以有多少个可能的超平面？无数条
如何选取使边际(margin)最大的超平面 (Max Margin Hyperplane)？
超平面到一侧最近点的距离等于到另一侧最近点的距离，两侧的两个超平面平行

3.3 线性可区分(linear separable) 和线性不可区分（linear inseparable)

在这里插入图片描述
尽可能把两类点区分开，但是还是有一个红叉在蓝色区域内，线型不可分。

在一个圆圈内，你无论从哪个放心画一条线，都是无法将红点和蓝点区分，线型不可分。

还是有一个灰色点导致线型不可区分。
这儿先只考虑简单的线型可区分的情况。

4. 定义与公式建立

超平面可以定义为：
在这里插入图片描述
W: weight vectot, （W和X 的维度是对应的 W : 1乘以n , X : n乘以1）

n 是特征值的个数
X: 训练实例
b: bias（偏向）

4.1 假设2维特征向量：X = (x1, X2)

把 b 想象为额外的 wight
超平面方程变为：
在这里插入图片描述
所有超平面右上方的点满足：

所有超平面左下方的点满足：

调整weight，使超平面定义边际的两边：（yi 就是分别对应两平行线）

综合（H2两边同乘以-1）以上两式，得到：（1）

所有坐落在边际的两边的的超平面上的被称作”支持向量(support vectors)"
分界的超平面和H1或H2上任意一点的距离为（一边距离）
在这里插入图片描述
(i.e.: 其中||W||是向量的范数(norm))

所以，最大边际距离为：（两边之间距离）

5. 求解

5.1 SVM如何找出最大边际的超平面呢(MMH)？

利用一些数学推倒，以上公式（1）可变为有限制的凸优化问题(convex quadratic optimization)
利用 Karush-Kuhn-Tucker (KKT)条件和拉格朗日公式，可以推出MMH可以被表示为以下“决定边界 (decision boundary)”
在这里插入图片描述
支持向量点，+1 或着 -1

5.2 对于任何测试（要归类的）实例，带入以上公式，得出的符号是正还是负决定。

证明在超平面的某一侧。

6. 例子：

在这里插入图片描述

panddStephen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SVM-1

1. 背景：1.1 最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出1.2 目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出，并在1995年发表1.3 深度学习（2012）出现之前，SVM被认为机器学习中近十几年来最成功，表现最好的算法2. 机器学习的一般框架：训练集...
复制链接

扫一扫