r语言 svm 大样本_【原创】R语言支持向量机svm实践案例报告附代码数据

支持向量机(SVM)是一种强大的分类算法,它利用超平面实现分类,并寻找最优的分类边界。本文介绍了SVM的基本思想,即最大化分类间隔,通过在高维空间找到最佳超平面将样本点分成两类。尽管存在多个可分超平面,SVM选择能最大化间隔的那一个以提高泛化能力。这一概念在二维和高维空间中均有应用,对于复杂数据集尤其有效。
摘要由CSDN通过智能技术生成

支持向量机(support vector machine)第一次见到这个词可能难以理解这个奇怪的名字,这是一个90年代产生在深度学习出来之前逼格满满的算法,被认为是适应性最广的分类器之一。SVM是一个基于严格的数学推导的算法(但本文不推导),本文只大概介绍基本思想和简单原理及实践过程。

最大间隔分类器

在二维平面上,一条直线可以把平面分成两边;在三维空间中,一个平面可以把空间分成两块……那么同理,在p+1的高维空间中,一个p维的超平面也可以将其成本两部分,超平面的定义:

8ce3a6eb0c8b46f011fd7ff8629cb35d.png

超平面的定义

根据高中空间几何的知识可知,把一个点代入上式,如果等于0说明正好在超平面上;大于0在其上方,小于0在其下方。

那么就可以根据这个特点来映射二分类问题。只要我们可以构建出超平面方程,再把样本点代入,根据结果的正负就可以进行分类。

53841937230fb4c9a313e81e5b089b10.png

超平面分隔

实际上,能把不同类别样本分隔开来的超平面并不止一个,有无数个。如图中蓝色和橙色虚线都能把两类样本分开,那么你认为这两个哪一个分隔效果更好?

如果用蓝色分隔超平面,那上面的白球就被分成橙色,下面的白球则被分成蓝色;如果用橙色分隔超平面,则结果完全相反。可是根据KNN的思想,很容易看出上面的白球应该被分成蓝色,下面的白球应该被分成橙色。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值