SVM几种核函数的对比分析以及SVM算法的优缺点

SVM核函数的作用

SVM核函数是用来解决数据线性不可分而提出的,把数据从源空间映射到目标空间(线性可分空间)。

SVM中核函数的种类

1、线性核

优点:

  • 方案首选,奥卡姆剃刀定律
  • 简单,可以求解较快一个QP问题
  • 可解释性强:可以轻易知道哪些feature是重要的

限制:只能解决线性可分问题

2、多项式核

基本原理:依靠升维使得原本线性不可分的数据线性可分;
升维的意义:使得原本线性不可分的数据线性可分;

优点:

  • 可解决非线性问题
  • 可通过主观设置幂数来实现总结的预判

缺点:

  • 对于大数量级的幂数,不太适用
  • 比较多的参数要选择

通常只用在已经大概知道一个比较小的幂数的情况
在这里插入图片描述

3、高斯核

优点:

  • 可以映射到无限维
  • 决策边界更为多样
  • 只有一个参数,相比多项式核容易选择

缺点:

  • 可解释性差(无限多维的转换,无法算w)
  • 计算速度比较慢(解一个对偶问题)
  • 容易过拟合(参数选不好时容易overfitting)

4、Sigmoid核

采用Sigmoid函数作为核函数时,支持向量机实现的就是一种多层感知器神经网络,应用SVM方法,隐含层节点数目(它确定神经网络的结构)、隐含层节点对输入节点的权值都是在设计(训练)的过程中自动确定的。而且支持向量机的理论基础决定了它最终求得的是全局最优值而不是局部最小值,也保证了它对于未知样本的良好泛化能力而不会出现过学习现象。

在实战中更多的是:

  • 特征维数高选择线性核
  • 样本数量可观、特征少选择高斯核(非线性核)
  • 样本数量非常多选择线性核(避免造成庞大的计算量)

SVM的优缺点

1、SVM算法对大规模训练样本难以实施

SVM的空间消耗主要是存储训练样本和核矩阵,由于SVM是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算(m为样本的个数),当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间。针对以上问题的主要改进有有J.Platt的SMO算法、T.Joachims的SVM、C.J.C.Burges等的PCGC、张学工的CSVM以及O.L.Mangasarian等的SOR算法。如果数据量很大,SVM的训练时间就会比较长,如垃圾邮件的分类检测,没有使用SVM分类器,而是使用了简单的naive bayes分类器,或者是使用逻辑回归模型分类。

2、用SVM解决多分类问题存在困难

经典的支持向量机算法只给出了二类分类的算法,而在数据挖掘的实际应用中,一般要解决多类的分类问题。可以通过多个二类支持向量机的组合来解决。主要有一对多组合模式、一对一组合模式和SVM决策树;再就是通过构造多个分类器的组合来解决。主要原理是克服SVM固有的缺点,结合其他算法的优势,解决多类问题的分类精度。如:与粗集理论结合,形成一种优势互补的多类问题的组合分类器。

3、对缺失数据敏感,对参数和核函数的选择敏感

支持向量机性能的优劣主要取决于核函数的选取,所以对于一个实际问题而言,如何根据实际的数据模型选择合适的核函数从而构造SVM算法。目前比较成熟的核函数及其参数的选择都是人为的,根据经验来选取的,带有一定的随意性.在不同的问题领域,核函数应当具有不同的形式和参数,所以在选取时候应该将领域知识引入进来,但是目前还没有好的方法来解决核函数的选取问题。

不同核函数在支持向量机(SVM)中的作用和效果是不同的。线性核函数是最简单的核函数,适用于线性可分的情况,它的分类效果很理想。多项式核函数可以将低维的输入空间映射到高维的特征空间,但是当多项式的阶数较高时,计算复杂度会变得很高。高斯(RBF)核函数是一种局部性强的核函数,它可以将样本映射到一个更高维的空间内,具有较好的性能,且参数较少。sigmoid核函数可以实现支持向量机作为一种多层神经网络的实现。 选择合适的核函数取决于实际问题和数据模型。目前,核函数的选择通常是基于经验的,没有一个确定的方法来解决核函数的选取问题。如果对数据有一定的先验知识,可以根据先验知识选择符合数据分布的核函数。如果没有先验知识,可以使用交叉验证的方法来试用不同的核函数,选择误差最小的作为效果最好的核函数。也可以将多个核函数结合起来形成混合核函数。 在吴恩达的课程中,也提供了一些选择核函数的方法。如果特征的数量和样本数量相差不大,可以选择逻辑回归(LR)或线性核的SVM。如果特征的数量较小,样本数量正常,可以选择SVM+高斯核函数。如果特征的数量较小,而样本数量很大,可以通过手工添加一些特征来转化为第一种情况。 因此,不同核函数SVM中的区别主要体现在它们的映射能力、计算复杂度和适用场景上。根据实际问题和数据特点选择合适的核函数可以提高SVM的分类性能。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *3* [svm常用核函数](https://blog.csdn.net/batuwuhanpei/article/details/52354822)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [SVM几种核函数的对比分析以及SVM算法优缺点](https://blog.csdn.net/qq_29462849/article/details/89516133)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值