机器学习Sklearn——核函数参数的选取、硬间隔和软间隔、重要参数C

本文通过乳腺癌数据集,详细探讨了RBF核函数的gamma参数和多项式核函数的degree、coef0参数的选择方法,包括学习曲线和网格搜索。同时介绍了SVM中的软间隔和硬间隔概念,重点解析了C参数对决策边界的影响力。最终给出了线性核函数和RBF核函数在乳腺癌数据上的最优参数配置。
摘要由CSDN通过智能技术生成

目录

1 核函数参数的选取

1.1 rbf调节gamma——绘制学习曲线

1.2 poly调节三个参数——网格搜索

2 软间隔和硬间隔

 2.1 重要参数C


1 核函数参数的选取

Kernel的参数我们上次就已经讲解过了:

机器学习Sklearn——核函数、核函数在不同数据集上的表现、核函数的优势和缺点_chelsea_tongtong的博客-CSDN博客

在知道如何选取核函数之外,我们还要观察一下除了Kernel以外的核函数相关的参数 ,对于线性核函数,kernel是唯一能影响他的参数,但是对于其他三种非线性核函数,他们还受到参数gamma ,degree,coef0的影响,其中多项式核函数受到三个参数的影响,而高斯径向基受到gamma的影响。

   从核函数的公式来说,很难界定每个参数如何影响SVM。核函数本身不是单调的,所以我们想推导核函数的参数变化如何影响核函数从而影响预测函数,从而影响决策边界,是很困难的。

所以想探究这些参数变化如何影响核函数,可以用学习曲线或者网格搜索来帮助我们查找最佳参数组合。

  我们此次依旧使用乳腺癌数据集。

1.1 rbf调节gamma——绘制学习曲线

score = []
gamma_range = np.logspace(-10,1,50) # 对数刻度上均匀间隔的数字,从-10到1取五十个等间隔的对数
for i in gamma_range:
    clf = SVC(kernel='rbf', gamma=i, cache_size=1000).fit(x_train, y_train)
    score.append(clf.score(x_test,y_test))
    
print(max(score), gamma_range[score.index(max(score))])
plt.plot(gam
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值