SVM中惩罚参数C的理解

参考文献:https://www.zhihu.com/question/40217487?sort=created
C理解为调节优化方向中两个指标(间隔大小,分类准确度)偏好的权重
soft-margin SVM针对hard-margin SVM容易出现的过度拟合问题,适当放宽了margin的大小,容忍一些分类错误(violation),把这些样本当做噪声处理,本质上是间隔大小和噪声容忍度的一种trade-off,至于具体怎么trade-off,对哪个指标要求更高,那就体现在C这个参数上了。

  1. 当C趋于无穷大时,这个问题也就是不允许出现分类误差的样本存在,那这就是一个hard-margin SVM问题(过拟合)
  2. 当C趋于0时,我们不再关注分类是否正确,只要求间隔越大越好,那么我们将无法得到有意义的解且算法不会收敛。(欠拟合)
  • 9
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
确定支持向量机(SVM)的惩罚参数和核函数参数是使用SVM进行模型训练的关键步骤。下面是一些常见的方法来确认这些参数: 1. 惩罚参数(C)的确认: - 交叉验证:使用交叉验证技术,将数据集划分为训练集和验证集,并尝试不同的惩罚参数取值。通过在不同参数下训练模型并在验证集上评估性能,选择表现最佳的惩罚参数。 - 网格搜索:通过在一定范围内网格搜索惩罚参数的取值,根据模型在验证集上的性能选择最优参数。这种方法需要指定一个惩罚参数的取值范围和步长。 2. 核函数参数的确认: - 网格搜索:与惩罚参数类似,通过在一定范围内网格搜索核函数参数的取值,根据模型在验证集上的性能选择最优参数。常用的核函数包括线性核、多项式核和高斯核等。 - 领域知识:根据对问题的理解和经验,选择适合问题特征的核函数和相应的参数。例如,在处理文本分类问题时,使用高斯核函数可能更适合捕捉非线性关系。 - 经验法则:有些核函数参数具有经验法则,可以根据数据集的大小或特性进行选择。例如,高斯核函数的参数 γ 可以根据数据集的方差估计或通过试验选择一个合适的值。 无论使用何种方法来确认SVM惩罚参数和核函数参数,都需要注意避免过拟合或欠拟合的情况。最好在训练集和验证集上进行多次实验和评估,确保选择的参数能够在未见过的数据上具有较好的泛化性能。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值