【《机器学习》第6章支持向量机】间隔与支持向量+对偶问题+核函数+软间隔与硬间隔

线性分类器回顾

在一个线性分类中,我们可能会拟合出多条直线来完全区分样本类别,但是这些直线中有没有好坏呢?

答案是肯定的。

A与B分类对比

间隔与支持向量

  • 支持向量:距离超平面最近的样本点(可能是两个或者多个)。
  • 间隔:两个异类 支持向量到超平面的距离之和

支持向量机就是寻找具有最大间隔 的超平面。

间隔方程

见课件例题

优化问题的类型

无约束优化问题

求解方法:求取函数 f ( x ) f(x) f(x) 的导数,然后令其为零,可以求得候选最优值,再在这些候选值中验证;如果是凸函数,可以保证是最优解。

有等式约束优化问题

即把等式约束 h i ( x ) h_i(x) hi(x) 用一个系数与 f ( x ) f(x) f(x) 写为一个式子,称为拉格朗日函数,而系数称为拉格朗日乘子。通过拉格朗日函数对各个变量求导,令其为零,可以求得候选值集合,然后验证求得最优值。

既有等式约束又有不等式约束优化问题

把所有的等式约束、不等式约束与 f ( x ) f(x) f(x) 写成一个式子,这个式子也叫拉格朗日函数,系数也称为拉格朗日乘子,通过一些条件,可以求出最优值的必要条件,这个条件就称为 KKT条件。

对偶问题

解的稀疏性

解的稀疏性 :训练完成后,最终的模型仅与支持向量有关!

软间隔与硬间隔

  • 硬间隔:所有的样本都满足约束条件
  • 软间隔:允许一定量的样本不满足约束条件

硬间隔vs软间隔

核函数

如果在一个二维平面上有【(0,0),(0,1),(1,0),(1,1)】,其中【(0,0),(1,1)】属于一类,【(0,1),(1,0)】属于另外一类,那么我们用支持向量机就不能进行划分。那我们该怎么做呢?

数学上可以证明,如果原始空间是有限维,即属性数有限,则一定存在一个高维特征空间使样本可分。将样本从原始空间映射到一个更高维的特征空间 , 使样本在这个特征空间内线性可分。

二维变三维

核函数在这里的作用是将样本数据扩展到高维。

每一个核函数都隐式的定义了一个特征映射函数。

这个时候设计核函数就成了决定支持向量机性能的关键!

核函数

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

落难Coder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值