SVM算法（三）（有监督学习）

最新推荐文章于 2022-05-11 21:42:53 发布

不断进取前进

最新推荐文章于 2022-05-11 21:42:53 发布

阅读量1.4k

点赞数

文章标签： svm 算法

本文链接：https://blog.csdn.net/Chenyukuai6625/article/details/74094439

版权

五、SMO算法
针对数据不完全线性可分的超平面，已将问题转化为下式（详情可参考SVM算法（二））：

现在的问题是，针对要求的最小值方程和约束条件找到一组α_i=(α₁,α₂,…,α_n)使得W(a)的值最小。最初的约束条件为：1−y_i(Wx_i+b)≤0。将其带入到优化问题中就有KKT条件：α_i(1−y_i(Wx_i+b))=0。之前已分析过，α_i≥0，而1−y_i(Wx_i+b)≤0，所以这两个式子中间至少有一个值为0。其中有一个值为0的原因如下：假设刚开始的超平面可以将一些点正确分类，此时这些样本点就不再起作用，分对的样本点肯定满足y_i(Wx_i+b)>1，同时满足α_i(1−y_i(Wx_i+b))=0，所以α_i=0。而对于未被正确分类的样本点，约束其满足1−y_i(Wx_i+b)=0，它们对应的α_i不为0，至于是多少，需要看为正确分类的样本点在什么位置，如果位置偏离越大，α_i就越大，这样才能将其拉回到更合理的超平面上。
由上面的分析可知，对于数据不完全线性可分的情况，KKT条件应该如下：

其中u_i=(Wx_i+b)。样本分类正确与否会决定α_i的取值。
在寻找超平面的过程中需要根据是否满足KKT条件来进行调整，不满足就说明需要调整，由上面KKT条件可知，不满足KKT条件的情况有下面三种：

这三种情况下的α都需要进行调整。那么怎么调整呢？按照之前的分析需要从α中选取二个进行组合调整，假设调整α₁
和α₂。之前有个约束条件为：∑α_iy_i=0，所以可知：

因为y₁,y₂是标签，要么1要么-1。而两个α>=0。所以新的α是有范围的。先假设现在y₁=y₂=1或−1，即两个值相等，以都为1为例，此时可得：

因为α₁^new是在0-C之间，所以假设α₁^new=0,那么α₂^new可以取到最大值为ϵ，也就是α₁^old+α₂^old。而α₂^new又不能大于C，所以其最大取值为min(C,α₁^old+α₂^old)。同理如果α₁^new=C，那么α₂^new可以取到最小值为ϵ−C，也就是α₁^old+α₂^old−C,而α₂^new最小不能小于0，所以α₂^new的下限值就为max(0,α₁^old+α₂^old−C)。同理，可得当y₁不等于y₂，即一个为-1，一个为1时，可以得到其取值范围。最后的结果如下：

下面对α₂^new的值进行求解，因为首先只考虑α₁和α₂，而原问题为：

把这个式子乘开，把含有α₁和α₂单独拿出来，其它作为一块，原问题转化为：

v是一个与α₁,α₂,y₁,y₂有关的长式子，K是< x1∗x2 >的内积，最后面的式子跟α₁,α₂没有关系，现在的想法是利用下式：

将α₁的值用α₂来代替，然后带入W(α)将α₁消除，此时W(α)中只含有α₂，而其中含有的α₁^old和α₂^old是上一次迭代后的结果，是已知的。所以将W(α)对α₂进行求解就可以解出α₂^new。最后的结果下图所示：

求解得到的α₂^new是有限制范围的。求解得到α₂^new后再根据前面的式子，求得α₁^new。然后根据下式求得W的值：

同理，可以利用y_i(w∗x+b)−1=0这个等式求解b的值。求得的结果如下：

可以看出每次更新会有两个b，那么该选择哪个呢？选择的标准为谁准选谁，那么怎么判断准不准呢？判断标准就是看哪个α在0-C之间，α在0-C之间就认为该超平面在分界线的边界上，可以作为支持向量，此时对应的b的值更加准确。当α都不在0-C之间，b的值取两者的平均值。评判标准如下：

当更新完α₁和α₂，需要接着更新其它的α值，方法一样，两个两个更新，在这个时候需要分析如何高效地选择两个变量进行优化，使得目标函数下降的最快，这里用到的方法是启发式选择方法，要注意这里面更新的α的值都是不满足KKT条件的样本点。当所有的样本点都满足KKT条件就找到了最优的一组α_i=(α₁,α₂,…,α_n)解。
至此已经解决了数据不完全线性可分的问题，但是事情情况下还存在这线性不可分的问题，那此时该如何对非线性的样本进行处理呢？此时SVM算法是否还适应？答案是肯定的，SVM最强大的优势就是在于对非线性样本的处理和其处理的精准性。具体如何处理非线性数据请阅读下文SVM算法（四）。

不断进取前进

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SVM算法（三）（有监督学习）

五、SMO算法针对数据不完全线性可分的超平面，已将问题转化为下式（详情可参考SVM算法（二））：现在的问题是，针对要求的最小值方程和约束条件找到一组αi=(α1,α2,…,αn)使得W(a)的值最小。最初的约束条件为：1−yi(Wxi+b)≤0。将其带入到优化问题中就有KKT条件：αi(1−yi(Wxi+b))=0。之前已分析过，αi≥0，而1−yi(Wxi+b)≤0，所以这两个式子
复制链接

扫一扫