机器学习实战笔记——SVM算法

本文介绍了支持向量机(SVM)的基本原理,包括寻找最优超平面以最大化间隔,以及如何通过拉格朗日乘子法解决对偶问题。当面对非线性可分数据时,SVM通过核函数实现高维映射,确保在新的空间中实现线性划分。实验使用马病症数据集,训练集错误率为13%,测试集错误率为20%。
摘要由CSDN通过智能技术生成

      我理解的支持向量机,就是找到个超平面,将样本空间划分为两类,并使得距离超平面最近的点尽可能远。基于数据集中某几个样本点就能找到这样的超平面,这些样本点称为支持向量。如果只是简单划分为两类,下图中5条线都可以,但如果满足最优划分,只有粗线满足了。

超平面满足线性方程

ωTx+b=0

任意点到超平面的距离为

                                                                                      

两个异类支持向量到超平面的距离之和为

被称为间隔。我们的目标是找到使间隔最大的划分超平面。即满足下式

为了优化方便可以等价为

对上式使用拉格朗日乘子法得到其对偶问题,在强对偶优化的前提下,对偶问题的最优解就是原问题的最优解。那么我们可以通过求解对偶问题

解出α,ω和b,可以得到模型

但如果样本空间不是线性可分的,我们需要将其映射到更高维空间,使得在高维空间内线性可分。如果原始空间是有限维的,那么总是能找到一个高维特征空间线性可分。


我们做x到Φ(x)的映射后,优化方程的对偶问题成为了下式

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值