【111】支持向量机原理及python实现

本文介绍了支持向量机的基本概念,包括几何间隔、最大间隔超平面以及核方法。通过线性SVC和SVR在鸢尾花数据集上的应用展示了分类效果,并探讨了支持向量、正则化以及不同核函数的作用。最后,以乳腺癌检测为例,讨论了特征选择对模型性能的影响。
摘要由CSDN通过智能技术生成

内容目录

一、基本概念二、鸢尾花实验三、乳腺癌检测实验

一、基本概念

 【024】SVM有监督学习LinearSVC, LinearSVR,SVC,SVR参数解释

 线性支持向量机

        在超平面确定的情况下,可以相对地表示点距离超平面的远近。对于两类分类问题,如果,则的类别被判定为1;否则判定为-1(参考:https://zhuanlan.zhihu.com/p/31886934)。训练完成后,大部分的训练样本都不需要保留,最终模型仅与支持向量有关。(https://cloud.tencent.com/developer/article/1424413   https://www.kesci.com/home/project/5de08a8dca27f8002c4afe3b)

      所以如果,则认为的分类结果是正确的,否则是错误的。且的值越大,分类结果的确信度越大。反之亦然。

        所以样本点与超平面之间的函数间隔定义为

但是该定义存在问题:即同时缩小或放大M倍后,超平面并没有变化,但是函数间隔却变化了。所以,需要将的大小固定,如,使得函数间隔固定。这时的间隔也就是几何间隔 。

        几何间隔的定义如下

        实际上,几何间隔就是点到超平面的距离。想像下中学学习的点到直线的距离,点到直线的距离公式

        

        所以在二维空间中,几何间隔就是点到直线的距离。在三维及以上空间中,就是点到超平面的距离。而函数距离,就是上述距离公式中的分子,即未归一化的距离。

        定义训练集到超平面的最小几何间隔是 ,实际上这个距离就是我们所谓的支持向量到超平面的距离。

        SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧,且样本到超平面的几何间隔最大。根据以上定义,SVM模型的求解最大分割超平面问题可以表示为以下约束最优化问题


        将约束条件两边同时除以 

  • 4
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值