机器学习四基于支持向量机SVM模型实现对mnist数据集的分类

最新推荐文章于 2023-07-03 17:37:03 发布

江南无妖

最新推荐文章于 2023-07-03 17:37:03 发布

阅读量4.1k

点赞数 2

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caoyitong/article/details/123754580

版权

机器学习专栏收录该内容

8 篇文章 2 订阅

订阅专栏

算法

支持向量机学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。对于线性可分的训练数据集而言，线性可分分离超平面有无穷多个，但是几何间隔最大的分离超平面是唯一的。这里的间隔最大化又称为硬间隔最大化。而当训练数据集近似线性可分时，为软间隔最大化。

代码分析：

1.初始化数据

①对data数据转化为0-1浮点型进行归一化处理

②将label值进行二值化

2.对SVM模型进行训练

（1）对SVM相关参数初始化

① Sigma    高斯核中分母的σ
② C         软间隔中的惩罚参数
③ toler    松弛变量

④K：提前计算高斯核得到结果K

（2）迭代100次，超过迭代次数还未收敛则强制停止

设置了参数变化指标，如果一次迭代后参数没有改变，说明达到了收敛状态，可以停止了。

（3）判断下标为i的α是否满足KKT条件

这里需要计算gxi:

可以发现这里的g（xi）需要计算前面的求和式，但是在支持向量机中，a>0的样本点（xi,yi）实例才是支持向量，而非支持向量的ai*yi*K(xj,xi)是为0的。这样可以大大减少计算。

（4）如果不满足KKT条件就通过SMO算法进行优化。

SMO算法在每个子问题中选择两个变量优化，其中至少一个变量是违反KKT条件的。

SMO通过外层循环，在训练样本中选取违反KKT 条件最严重的样本点，并将其对应的变量作为第一个变量。第一个变量α的下标i已经确定。这里选择的是遇到的第一个违反KKT 条件的样本点。

接下来第二步选择变量2，通过内层循环，选择a2，使其对应|E1-E2|的值最大。由于变量2的选择中涉及到|E1 - E2|，因此先计算E1。

如果E1是正的，选择最小的Ei作为E2，反之选最大的Ei。

这挑选E2的时候，进行了一次优化算法。在Ei的初始化中，由于所有α为0，所以一开始是设置Ei初始值为-yi。这里修改为与α一致，初始状态所有Ei为0，在运行过程中再逐步更新。当程序检测到并没有Ei为非0时，将会使用随机函数随机挑选一个,将减少一部分时间消耗。

依据标签是否一致来生成不同的L和H，如果两者相等，说明该变量无法再优化，直接跳到下一次循环，否则就计算a的新值

全部计算结束后，重新遍历一遍α，查找里面的支持向量

3.进行预测

遍历所有支持向量，计算求和式，如果是非支持向量，求和子式必为0，没有必须进行计算

4.进行测试

可以发现这里的g（xi）需要计算前面的求和式，但是在支持向量机中，a>0的样本点（xi,yi）实例才是支持向量，而非支持向量的ai*yi*K(xj,xi)是为0的。这样可以大大减少计算。

关注

2
点赞
踩
27

收藏

觉得还不错? 一键收藏
2
评论
机器学习四基于支持向量机SVM模型实现对mnist数据集的分类

算法支持向量机学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。对于线性可分的训练数据集而言，线性可分分离超平面有无穷多个，但是几何间隔最大的分离超平面是唯一的。这里的间隔最大化又称为硬间隔最大化。而当训练数据集近似线性可分时，为软间隔最大化。代码分析： 1.初始化数据 ①对data数据转化为0-1浮点型进行归一化处理 ②将label...
复制链接

扫一扫

专栏目录

江南无妖 CSDN认证博客专家 CSDN认证企业博客

码龄4年

33: 原创

12万+: 周排名

7万+: 总排名

7万+: 访问

: 等级

459: 积分

3667: 粉丝

75: 获赞

10: 评论

477: 收藏

私信

关注

热门文章

分类专栏

最新评论

机器学习四基于支持向量机SVM模型实现对mnist数据集的分类
m0_62996181: 求份源码谢谢
华为机试HJ16 购物单 C语言动态规划详细解答
江南无妖: (๑•̀ㅂ•́)و✧
PE文件解析--导入函数节.rdata
◇邹◇: 文中计算api个数那里一个减的直接就是dll的数量吧，毕竟对于每个dll都要有一个全0的结束符。还是谢谢作者的文章，写的很好。
密码学实现64bit RSA c语言
Paintrain: 64位rsa计算中途会产生大概96位数，这个unsigned long long int是怎么能处理的到的。。
华为机试HJ16 购物单 C语言动态规划详细解答
Tiger_pop: 这5种情况的分类讨论，感觉跳过了一些解释，我补充一下您看看对不对：首先是判断给定的钱数满足了主产品需求吗，到了就判断是否取了i，所以不取的情况还是 dp[i-1][j]；而之后的三个if 判断有点类似于冒泡，在上一个判断的基础上层层递进，目的是求五种情况中的最大值，所以每种情况不取时不在写 dp[i-1][j] 而是 dp[i][j]， dp[i][j] 指的是上一种情况Max 判断后的结果，层层递进选出五种情况的最大值。

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。