手工实现：SVM with Stochastic Gradient Descent

最新推荐文章于 2022-10-29 16:31:20 发布

Allison-QKL

最新推荐文章于 2022-10-29 16:31:20 发布

阅读量1.5k

点赞数 1

分类专栏： ML 文章标签：机器学习 SVM 支持向量机 Stochastic Gradient Descent 梯度下降

本文链接：https://blog.csdn.net/qq_31584013/article/details/88679436

版权

本文介绍了如何手动实现SVM，重点在于理解SVM的直观概念、梯度下降法以及随机梯度下降（SGD）。通过人口普查数据集建立分类器，以预测收入情况。在训练过程中，利用SGD减少计算量，实现在大数据集上的应用。最终展示了准确率和模型幅度随训练过程的变化。

摘要由CSDN通过智能技术生成

手工实现：SVM with Stochastic Gradient Descent

引入
实际问题
理论知识
实现
- 选择
- 思路
- 结果
后记
Reference

引入

之前的两篇我们一直在搞Naive Bayes Classifier，今天我们来换一个分类器试试。
SVM（support vector machine），支持向量机，虽让从名字上看不出来，但是它确实是个分类器。如果搜索引擎搜一下SVM的话，其实已经有很多资料很详细的介绍了SVM，但是正如之前两篇一样，本篇文章会着重于直观的解释相关知识点，并以解决实际问题为导向手工实现该算法。

实际问题

我们能否基于人口普查数据建立分类器，并对收入情况进行预测？
本次试验中，我们将使用UCI的 “Adult Data Set”。该数据集包含了被调查者的年龄、受教育程度、工作岗位、性别等信息，并且标出了被调查者的收入分类（>50K，<=50K）。
data
在实现过程中，我们将在训练集上建立 SVM, 在测试集上评估模型的精度。

理论知识

SVM

直观认识

首先让我们举个栗子，直观认识一下SVM。
假设我们现在有这样一个训练集：
维度有 $x_{(1)}$ 、 $x_{(2)}$ 两个；类有正类、负类两个，正类由红色表示，负类由蓝色表示。
SVM1
如果我们用一个SVM分类，它将这样做：
1、使用某个函数 $h (x)$ ，图例中为 $a^TX+b$ ，对所有的点进行处理，将它们投到一个新的维度（ $\gamma$ ）当中。 $\gamma$ > 0 的点被预测为正类， $\gamma$ < 0 的点被预测为负类。
2、通过一定方法找到步骤1中分的最好的函数（cost最低的），直观上来讲，这个函数对应的那个灰色矩形平面就是我们训练出来的模型。
SVM2
3、若是要预测新的点的类别，只需要用同样函数处理新来的点（粉）， $\gamma$ > 0 则被预测为正类， $\gamma$ < 0 则被预测为负类。
SVM3

什么是分的好？

作为一只有追求的分类器就想要尽量分类分的好，但是究竟什么是分的好呢？

1、是不是只要都分对了就是分的好？

并不是~ 因为除了分对以外，我们还想要分的开。
SVM4
如果我们只是以分对为标准，那么 $l_1$ 和 $l_2$ 就没有什么差别。
SVM5
但是实际情况并非如此。如果我们在训练集上分的不够开，那么将来就很有可能出现像紫点这样的情况。
SVM6
所以我们在训练时就要考虑尽量分开这件事，即：在交线附近划一个区域，如果有离得太近的点（ $e_1$ ）存在，模型也要付出一丢丢代价。（当然如果本身都已经分错了的话，代价就会更高，而且错的越离谱代价越大（离分界越远，代价越大））
体现在数学上，就是我们使用 Hinge Loss 作为 cost function。在这个例子中就是：
$\gamma) = max(0, 1-y \gamma)$
其中ÿ

最低0.47元/天解锁文章

Allison-QKL

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
手工实现：SVM with Stochastic Gradient Descent

手工实现：SVM with Stochastic Gradient Descent引入实际问题理论知识SVM直观认识什么是分的好？1、是不是只要都分对了就是分的好？2、是不是只要训练集分的好就是分的好？Gradient Descentcost 最小的模型Gradient Descent 是啥SGD（Stochastic Gradient Descent）实现选择结果后记Reference引入之...
复制链接

扫一扫

专栏目录