SVM核函数的选择

67 篇文章 4 订阅

SVM核函数的选择对于其性能的表现有至关重要的作用,尤其是针对那些线性不可分的数据,因此核函数的选择在SVM算法中就显得至关重要。对于核技巧我们知道,其目的是希望通过将输入空间内线性不可分的数据映射到一个高纬的特征空间内使得数据在特征空间内是可分的,我们定义这种映射为ϕ(x)ϕ(x),那么我们就可以把求解约束最优化问题变为


但是由于从输入空间到特征空间的这种映射会使得维度发生爆炸式的增长,因此上述约束问题中内积ϕi⋅ϕjϕi⋅ϕj的运算会非常的大以至于无法承受,因此通常我们会构造一个核函数

从而避免了在特征空间内的运算,只需要在输入空间内就可以进行特征空间的内积运算。通过上面的描述我们知道要想构造核函数κκ,我们首先要确定输入空间到特征空间的映射,但是如果想要知道输入空间到映射空间的映射,我们需要明确输入空间内数据的分布情况,但大多数情况下,我们并不知道自己所处理的数据的具体分布,故一般很难构造出完全符合输入空间的核函数,因此我们常用如下几种常用的核函数来代替自己构造核函数:

  • 线性核函数 

    线性核,主要用于线性可分的情况,我们可以看到特征空间到输入空间的维度是一样的,其参数少速度快,对于线性可分数据,其分类效果很理想,因此我们通常首先尝试用线性核函数来做分类,看看效果如何,如果不行再换别的
  • 多项式核函数 

    多项式核函数可以实现将低维的输入空间映射到高纬的特征空间,但是多项式核函数的参数多,当多项式的阶数比较高的时候,核矩阵的元素值将趋于无穷大或者无穷小,计算复杂度会大到无法计算。
  • 高斯(RBF)核函数 

    高斯径向基函数是一种局部性强的核函数,其可以将一个样本映射到一个更高维的空间内,该核函数是应用最广的一个,无论大样本还是小样本都有比较好的性能,而且其相对于多项式核函数参数要少,因此大多数情况下在不知道用什么核函数的时候,优先使用高斯核函数。
  • sigmoid核函数 

    采用sigmoid核函数,支持向量机实现的就是一种多层神经网络。

因此,在选用核函数的时候,如果我们对我们的数据有一定的先验知识,就利用先验来选择符合数据分布的核函数;如果不知道的话,通常使用交叉验证的方法,来试用不同的核函数,误差最下的即为效果最好的核函数,或者也可以将多个核函数结合起来,形成混合核函数。在吴恩达的课上,也曾经给出过一系列的选择核函数的方法:

  • 如果特征的数量大到和样本数量差不多,则选用LR或者线性核的SVM;
  • 如果特征的数量小,样本的数量正常,则选用SVM+高斯核函数;
  • 如果特征的数量小,而样本的数量很大,则需要手工添加一些特征从而变成第一种情况。
  • 9
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在sklearn中,SVM模型提供了多种核函数选择。常用的核函数有以下几种: 1. 线性核函数(linear):线性核函数是最简单的一种核函数,它在原始特征空间中实现线性分类器,适用于特征空间是线性可分的情况。 2. 多项式核函数(poly):多项式核函数通过将样本映射到高维空间来实现非线性分类。它可以定义为在原始特征空间中进行多项式函数运算后的内积。 3. RBF核函数(rbf):径向基函数(RBF)核函数是一种常用的非线性核函数。它通过将样本映射到无穷维的特征空间来实现非线性分类。RBF核函数在实际应用中被广泛使用,因为它具有很好的表示能力。 4. Sigmoid核函数(sigmoid):Sigmoid核函数将样本映射到高维空间,并通过Sigmoid函数来实现非线性分类。它主要用于二分类问题。 在使用sklearn中的SVM模型时,可以通过设置参数`kernel`来指定所需的核函数。默认情况下,SVM模型的核函数为RBF核函数。例如,可以使用以下代码创建一个使用多项式核函数SVM模型: ```python from sklearn.svm import SVC # 创建SVM模型,使用多项式核函数 svm_model = SVC(kernel='poly') ``` 需要根据具体的数据集和问题选择合适的核函数。在实际应用中,可以通过尝试不同的核函数并比较它们在训练集和测试集上的性能来选择最佳的核函数。在选择核函数时,需要考虑数据集的线性可分性、特征空间的维度以及模型的复杂度等因素。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值