机器学习面试SVM常见问题汇总

最新推荐文章于 2024-08-08 20:50:38 发布

文达（初学者）

最新推荐文章于 2024-08-08 20:50:38 发布

阅读量3.1k

点赞数 6

分类专栏：机器学习面试

本文链接：https://blog.csdn.net/qq_38489833/article/details/107055543

版权

本文详细介绍了SVM（支持向量机）的基本原理，包括间隔、对偶问题和核技巧。讨论了SVM与LR的区别，解释了为何要转换为对偶问题以及SVM对缺失数据的敏感性。同时，分析了SVM在大规模数据中的适用性，与其他分类器如贝叶斯、决策树、神经网络和k-NN的优缺点比较，以及在多分类和回归问题中的应用。

摘要由CSDN通过智能技术生成

1. 简单介绍SVM（详细原理）

（回答的思路：从分类平面，到求两类间的最大间隔，到转化为求间隔分之一，等优化问题，然后就是优化问题的解决办法，首先是用拉格拉日乘子把约束优化转化为无约束优化，对各个变量求导令其为零，得到的式子带入拉格朗日式子从而转化为对偶问题，最后再利用SMO（序列最小优化）来解决这个对偶问题。svm里面的c有啥用）
个人理解：SVM又叫最大间隔分类器，最早用来解决二分类问题。SVM有三宝，间隔，对偶，核技巧。****

1.1间隔：

1.1.1 hard-margin svm (数据完全线性可分)

在这里插入图片描述

1.1.2 soft-margin svm(数据近似线性可分)

个人理解为 hard-margin svm + loss

loss 损失函数有：
0-1 损失函数（函数不连续可导）
合页损失函数 (max( 0, 1 - yi * ( wx + b )))**
在这里插入图片描述
**其中 c为惩罚系数，调节优化方向中两个指标（间隔大小，分类准确度）偏好的权重. C值越大，分类器就越不愿意允许分类错误（“离群点”）。如果C值太大，分类器就会竭尽全力地在训练数据上少犯错误，而实际上这是不可能/没有意义的，于是就造成过拟合。而C值过小时，分类器就会过于“不在乎”分类错误，于是分类性能就会较差。