线性可分支持向量机

线性可分支持向量机和硬间隔最大化

  1. 线性可分支持向量机
    线性可分支持向量机的条件从名字就可以看出来,即训练集是“可分的”。
    如何才能算得上可分?
    先给出支持线性可分支持向量机的定义:给定线性可分训练数据集,通过间隔最大化或等价的求解相应的凸二次规划问题学习得到的分离超平面为
    在这里插入图片描述
    这个超平面法向量为w*,偏置为b*
    其决策函数为
    在这里插入图片描述
    看到这里如果看过我之前的博客,或者了解感知机的伙伴可能发现这不是和感知机的决策函数一样吗。
    而且对于这个超平面,分别在两侧将样本分为两类,这与感知机是一样的,起初在我学了感知机,再接触这个算法时也在疑惑,这跟感知机不一样的吗?好像没什么区别。
    事实上的确如此,可分支持向量机很多地方都与感知机一样,最大的不同在于它的分类超平面是唯一的,它的超平面是在理想的情况下取得最优的。
    说到这,需要好好的解释一下什么是在理想的情况下最优的,前面我写的博客在感知机那一篇中提到:
    感知机是利用误分类的样本进行训练模型的,它的分类超平面不是唯一的,不一样的样本训练出的超平面不唯一,只要求能将训练样本正确分类就可以,其实这样会导致模型的泛化能力出现问题,以下面这个图为例,假设我们的样本是二维的,那我们感知机学习的模型应该是一条线,如下图,可有很多直线能将样本正确分为两类,可是你会发现,有的线太“偏激”。这什么意思呢?
    打个比方,公司要开会,说两点钟到报告厅,你偏偏踩点去,一点五十九去,又比如女生和男生约会,说晚上八点见面,男生偏偏七点五十九去。这就好像那些偏激的分类器,恰好能将训练数据集分类就行,不管未知数据。
    这样的缺点就比如,公司突然有点急事,提前五分钟,你迟到了。女朋友先到了,等了一会,发现你没来,不想约会了。
    感知机训练出来的分类器可能就会出现这种情况,容错率太低
    在这里插入图片描述

支持向量机恰好解决了这个苦恼,它的分类器要求最优,即容错率最好,泛化能力最强,它的超平面能将样本分类,且距离两类样本距离最大化。

这里我们还需要引入几何间隔的概念:
在这里插入图片描述
上式即为几何间隔的计算公式,可以发现若样本正确分类,该公式就是样本到超平面的距离公式,得到的值为正的,若错误分类得到的值则为负的。
给出这个概念结合上面我么我们所说的给出可分支持向量积的约束优化问题:
在这里插入图片描述
这个约束问题的目的就是,我们需要找到一个超平面,使离超平面最近的点到超平面的距离最大,且可以将样本完全划分。
今天就到这吧,下一篇博客我准备详细讲解一下上面这个公式。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值