机器学习之支持向量机

echo婷

于 2020-10-30 08:58:13 发布

阅读量679

点赞数

文章标签：支持向量机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zt2494653702/article/details/109351765

版权

一支持向量机（SVM）基本概率

1.1 定义

SVM：寻找到一个超平面使样本分成两类，并且间隔最大

1.2 硬间隔和软间隔

（1）硬间隔

严格地让所有实例都不在最大间隔之间，并且位于正确的一边
问题：
它只在数据是线性可分离的时候才有效；其次，它对异常值非常敏感

（2）软间隔

尽可能在保持最大间隔宽阔和限制间隔违例之间找到良好的平衡
超参数C：C值越小，则间隔越宽，但是间隔违例也会越多

1.3 支持向量机流程

对样本数据进行归一化
应用核函数对样本进行映射（最常采用和核函数是RBF和Linear，在样本线性可分时，Linear效果要比RBF好）
用cross-validation和grid-search对超参数进行优选
用最优参数训练得到模型
测试

二支持向量机API

2.1 SVC

svm.SVC(C=1.0, kernel=‘rbf’, degree=3,coef0=0.0,random_state=None)

C: 惩罚系数，C越大，对误分类的惩罚增大，这样会出现训练集的准确率很高，但泛化能力弱，容易导致过拟合。C值小，对误分类的惩罚减小，容错能力增强，泛化能力较强，但也可能欠拟合。

kernel: 核函数类型，参数选择有RBF, Linear, Poly, Sigmoid或者自定义一个核函数。默认的是"RBF"：高斯核函数；Linear：线性核函数，Poly：多项式核，Sigmoid：双曲正切函数tanh核。

degree：当kernel='poly’时，表示选择的多项式的最高次数，默认为三次多项式；该参数只对’poly’有用。

coef0: 核函数常数值(y=kx+b中的b值)，只有‘poly’和‘sigmoid’核函数有，默认值是0。

from sklearn import svm
estimator = svm.SVC()
estimator.fit(x, y)

2.2 NuSVC

svm.NuSVC(nu=0.5)

SVC和NuSVC方法基本一致，唯一区别就是损失函数的度量方式不同，NuSVC中的nu参数和SVC中的C参数

nu取值在（0，1）之间，默认是0.5

from sklearn import svm
estimator = svm.NuSVC()
estimator.fit(x, y)

2.3 LinearSVC

svm.LinearSVC(penalty=‘L2’, loss=‘squared_hinge’, dual=True, C=1.0)

penalty：正则化参数，L1和L2两种参数可选，仅LinearSVC有。

loss：损失函数，有hinge和squared_hinge两种可选，前者又称L1损失，后者称为L2损失，默认是squared_hinge，其中hinge是SVM的标准损失，squared_hinge是hinge的平方

dual：是否转化为对偶问题求解，默认是True。

C：惩罚系数

三支持向量机优缺点

3.1 优点

（1）在高维空间中非常高效；
（2）即使在数据维度比样本数量大的情况下仍然有效；
（3）在决策函数（称为支持向量）中使用训练集的子集,因此它也是高效利用内存的；
（4）通用性：不同的核函数与特定的决策函数对应；

3.2 缺点

（1）如果特征数量比样本数量大得多，在选择核函数时要避免过拟合；
（2）对缺失数据敏感;
（3）对于核函数的高维映射解释力不强

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习之支持向量机

一支持向量机（SVM）基本概率1.1 定义SVM：寻找到一个超平面使样本分成两类，并且间隔最大。1.2 硬间隔和软间隔（1）硬间隔严格地让所有实例都不在最大间隔之间，并且位于正确的一边问题：它只在数据是线性可分离的时候才有效；其次，它对异常值非常敏感。（2）软间隔尽可能在保持最大间隔宽阔和限制间隔违例之间找到良好的平衡超参数C：C值越小，则间隔越宽，但是间隔违例也会越多二支持向量机APIfrom sklearn import svmestimator = svm.SVC()e
复制链接

扫一扫

echo婷 CSDN认证博客专家 CSDN认证企业博客

码龄4年

22: 原创

16万+: 周排名

182万+: 总排名

8966: 访问

: 等级

250: 积分

2: 粉丝

5: 获赞

6: 评论

29: 收藏

私信

关注

热门文章

最新评论

CSS总结四之浮动
向彪-blockchain: 文章非常有用，让我受益匪浅！
机器学习之集成学习初识
不正经的kimol君: 大佬的文章让我受益匪浅，如痴如醉，以后的日子还希望能够得到大佬的谆谆指点！
Seaborn总结
echo婷: 谢谢啦，一起加油鸭
机器学习之决策树
不正经的kimol君: 厉害，赞一个,欢迎回赞哦~
Seaborn总结
不正经的kimol君: 好文，鉴定完毕！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。