从零开始SVM

从零开始SVM

概述


       SVM全称support vector machine,中文名支持向量机,是分类算法中应用广泛、效果不错的一类。李航的《统计学习方法》对SVM的数学原理做了详细推导与论述。由简至繁SVM可分类为三类:线性可分(linear SVM in linearly separable case)的线性SVM、线性不可分的线性SVM、非线性(nonlinear)SVM。
       支持向量机名称的由来是:仅由支持向量建立分类面,那么什么是支持向量呢?
支持向量机
       我们可以看上面这张图,总共有两类点,实心点和空心点,现在要将两类点分类,即求一条线,线的一边全是实心点,线的另一边全是空心点,离分类线最近的点称作支持向量(如图中虚线上的一个黑点和两个白点)。按照如图的情况,有无穷多的线可以将两类点分离,那么问题来了,哪一条分类线是最优的呢?也就是说:哪一条线在对于未知样本(测试样本)的分类中可以取得最好的效果呢?
       SVM的想法是:每一条分类线和支持向量与之间是有间隔的(如图中的实线和虚线),使得间隔最大的分类线就认为是最优的分类线

几何间隔与函数间隔

        那么我们怎么来定义这个“间隔”呢?
        首先,我们定义分类线:

ax+by+c=0 a x + b y + c = 0

        假设存在一个点 (x0,y0) ( x 0 , y 0 ) ,它到分类线的距离(就是点到直线距离公式)是
d=|ax0+by0+c|a2+b2 d = | a x 0 + b y 0 + c | a 2 + b 2

        我们之前都是在二维的层面上讨论问题,现在我们将问题扩展之高维
        分类线转换成 分类超平面
wx+b=0 w ⋅ x + b = 0

优化目标

拉格朗日对偶与KKT条件

求解

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值