找到【SVM】中最优的惩罚项系数C

最新推荐文章于 2024-08-22 10:36:28 发布

数字生命Allen

最新推荐文章于 2024-08-22 10:36:28 发布

阅读量990

点赞数

文章标签：支持向量机机器学习人工智能

本文链接：https://blog.csdn.net/2301_78195908/article/details/134275900

版权

因为本来SVM是想找到间隔最大的分割面，所以C越大，SVC会选择边际更小的，能够更好的分类所有训练点的决策边界，不过模型的训练时间也会越长。如果C的设定值较小，那SVC会尽量最大化边界，决策功能会更简单，但代价是训练的准确度。

我们先来调线性核函数：

#调线性核函数
score = []
C_range = np.linspace(0.01,30,50)
for i in C_range:
    clf = SVC(kernel="linear",C=i,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为：0.9766081871345029 1.2340816326530613

可以看到准确率最高是97%以上。接下来我们来看看在rbf上的结果：

score = []
C_range = np.linspace(0.01,30,50)
for i in C_range:
    clf = SVC(kernel="rbf",C=i,gamma = 0.012742749857031322,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
    
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为：0.9824561403508771 6.130408163265306

既然最高的得分所对应的C值是6，那么我们可以在5-7之间进一步细化，看能否找到一个更好的局部最优：

#进一步细化
score = []
C_range = np.linspace(5,7,50)
for i in C_range:
    clf = SVC(kernel="rbf",C=i,gamma = 
0.012742749857031322,cache_size=5000).fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
    
print(max(score), C_range[score.index(max(score))])
plt.plot(C_range,score)
plt.show()

输出结果为：0.9824561403508771 5.938775510204081

可以看到，98.2456%就是我们最好的得分。

数字生命Allen

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
找到【SVM】中最优的惩罚项系数C

因为本来SVM是想找到间隔最大的分割面，所以C越大，SVC会选择边际更小的，能够更好的分类所有训练点的决策边界，不过模型的训练时间也会越长。如果C的设定值较小，那SVC会尽量最大化边界，决策功能会更简单，但代价是训练的准确度。输出结果为：0.9766081871345029 1.2340816326530613。输出结果为：0.9824561403508771 6.130408163265306。输出结果为：0.9824561403508771 5.938775510204081。
复制链接

扫一扫