第六、七课支持向量机

Support vector machines

SVM是监督性学习中属于基于“距离隔板”一类,该方法被认为是其中效果最好的方法之一。为了介绍SVM首先介绍margin和利用距离大小分离数据的概念。然后介绍optimal margin classi er,中间会使用到拉格朗日对偶。此外我们会介绍kernal,它能使SVM算法在高维特征空间上更加有效率。最后我们将介绍SMO优化算法,用于高效地SVM算法进行计算。

1.Margins

对于两组可完全分离的数据,可找到一个seperating hyperplane,使得两组数据分别位于该平面两侧,平面上的点满足 θTx=0
这里写图片描述

2.Notation

引入新的分类器形式:
这里写图片描述
g(z)=1 if z>=0,otherwise g(z)=1
该函数直接给出分类,而不是可能性。

3.Functional and geometric margins

对于给定的一个训练样本,对应样本的functional margin为:
这里写图片描述
该值应该恒大于0,该值越大,说明正确的可能性越高,分类效果越好。同一样本, ωb 乘以一个倍数,functional margin同样会以相同倍数增加,因此可以对 ω 进行归一化消除该歧义。
对于一个样本集合,对应的functional margin为所有样本的functional margin的最小值:
这里写图片描述]![这里写图片描述
类似的,定义样本的geometric margins:
这里写图片描述
样本集合的geometric margins:
这里写图片描述
值得注意的是,geometric margins不随 ω 的变化而改变。

4.The optimal margin classi er

根据上述分析,将该问题用公式表述:
这里写图片描述
即在一定约束条件下,使样本集对应的geometric margin最小,此时所对应的参数即为分离平面的参数,也就是optimal margin classi er。
因为上述约束中含有非凸约束,因此不宜求最优解,因此将问题表述进行转化:
这里写图片描述

再引入约束
这里写图片描述
得到问题最终转化形式
这里写图片描述
这种形式的优化问题能够使用quadratic programming (QP) code进行求解。

5.Lagrange duality

对于下面的问题:
这里写图片描述
定义Lagrangian为:
这里写图片描述
βi 叫做Lagrange multipliers。我们令L的偏导数为0:
这里写图片描述
解得 ωβ .

对该问题进行拓展,使得该方法能够解决约束中存在不等式的情况。定义primal optimization problem:
这里写图片描述
定义generalized Lagrangian为:
这里写图片描述
下表p的含义为primal,可以证明,当 ω 违反了约束条件,那么:
这里写图片描述
反之 θp(w)=f(w). ,因此我们得到:
这里写图片描述
因此将问题转化为:
这里写图片描述
其中 p=minωθp(ω) 我们叫做the value of the primal problem。
接下来我们定义该问题的对偶定义:
这里写图片描述
这里写图片描述
这里写图片描述
因为对一个函数先求极小再求极大总小于等于小球极大再求极小,我们得到:
这里写图片描述
但是在一些条件下,我们也可以得到:
这里写图片描述
我们来看看这些条件是什么:
假设f和g是凸函数,h是affine。假设约束g是可行的,即存在一些w使得g(w)<0对所有i都成立,在这些假设下,一定存在满足要求的解,并且 p=d .并且,存在如下条件Karush-Kuhn-Tucker (KKT)conditions :
这里写图片描述
由条件5和7得到,如果 αi>0 ,那么 gi(w)=0
之后我们会提到 SVM只存在少数量的支持向量,KKT也会在SMO算法中得到使用。

6.Optimal margin classi ers

回到之前讨论的最优margin分类的问题,我们已经得到如下表示:
这里写图片描述
约束为:
这里写图片描述
注意到当 αi>0 ,functional margin等于1。
这里写图片描述
事实上,如上图,只有距离超平面最近的几个点对应的 αi>0 ,这几个点的坐标称为Support vectors。
对于我们的问题建立拉格朗日算式:
这里写图片描述

这里写图片描述
得到
这里写图片描述

这里写图片描述
综合上式得到
这里写图片描述
这里写图片描述
得到问题的转化形式:
这里写图片描述
解出 α 即可表示出w。
容易证明:
这里写图片描述
当我们进行预测时,使用如下式子进行计算:
这里写图片描述
该式表明再进行预测时我们只需要计算待测点坐标与支持向量的内积。下节我们将应用该性质,得到支持向量机的算法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值