《机器学习实战》简化版SMO代码中2个判断条件的思考

最新推荐文章于 2023-02-24 22:06:26 发布

Zehui-Lin

最新推荐文章于 2023-02-24 22:06:26 发布

阅读量668

点赞数 3

文章标签：机器学习支持向量机 SMO 机器学习实战 python

本文链接：https://blog.csdn.net/eastokamak/article/details/89684339

版权

《机器学习实战》简化版SMO代码中2个判断条件的思考

准备工作
- 公式推导
- 代码
2个判断条件
- 第一个判断条件
- 第二个判断条件

最近在看《机器学习实战》，程序清单6-2，代码很长，但是代码解释里面作者有一些细节没有讲解到，通过学习SMO公式推导和看了一些博客，弄明白有2处判断条件，当作记录以后备查，也分享给大家，欢迎讨论交流。

准备工作

公式推导

首先当然是公式推导了，这是必备的，应该先看完公式推导再来编程，不然完全看不懂书里的代码在做什么。这里我查了周志华的《机器学习》、bishop的《Pattern Recognition and Machine Learning》、《Pattern Classification》、《Pattern Recognition》竟然都没有相关的详细推导过程。最后找到了李航的《统计学习方法》的7.4节有SMO非常详尽的从头到尾的推导，和《机器学习实战》书中代码是完全对应的，这里强烈推荐，本文的公式符号包括公式的标号也是按李航的书中书写。当然，想要深一步理解的同学，可以直接去看 platt的论文。《Learning with Kernels》里面也有推导，但是前后章节联系太密，要看懂这本书里面的推导，要前面很多小节都有看过，所以不是很建议。
这里有一篇博客也有详尽的推导过程，和李航的书是一模一样的，估计是书的扫描，不过好像也不是很全

https://blog.csdn.net/lyl771857509/article/details/79433184

代码

这里直接给出原书代码的github地址

https://github.com/pbharrin/machinelearninginaction/tree/master/Ch06

2个判断条件

好了，这里开始进入正题
2个判断条件主要出现在这个代码块中

while (iter < maxIter):
    alphaPairsChanged = 0
    for i in range(m):
        fXi = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b
        Ei = fXi - float(labelMat[i])#if checks if an example violates KKT conditions
        if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):
            j = selectJrand(i,m)
            fXj = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[j,:].T)) + b
            Ej = fXj - float(labelMat[j])
            alphaIold = alphas[i].copy(); alphaJold = alphas[j].copy();
            if (labelMat[i] != labelMat[j]):
                L = max(0, alphas[j] - alphas[i])
                H = min(C, C + alphas[j] - alphas[i])
            else:
                L = max(0, alphas[j] + alphas[i] - C)
                H = min(C, alphas[j] + alphas[i])
            if L==H: print "L==H"; continue
            eta = 2.0 * dataMatrix[i,:]*dataMatrix[j,:].T - dataMatrix[i,:]*dataMatrix[i,:].T - dataMatrix[j,:]*dataMatrix[j,:].T
            if eta >= 0: print "eta>=0"; continue
            alphas[j] -= labelMat[j]*(Ei - Ej)/eta
            alphas[j] = clipAlpha(alphas[j],H,L)
            if (abs(alphas[j] - alphaJold) < 0.00001): print "j not moving enough"; continue
            alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j])#update i by the same amount as j
                                                                    #the update is in the oppostie direction
            b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[i,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i,:]*dataMatrix[j,:].T
            b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[j,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j,:]*dataMatrix[j,:].T
            if (0 < alphas[i]) and (C > alphas[i]): b = b1
            elif (0 < alphas[j]) and (C > alphas[j]): b = b2
            else: b = (b1 + b2)/2.0
            alphaPairsChanged += 1
            print "iter: %d i:%d, pairs changed %d" % (iter,i,alphaPairsChanged)

第一个判断条件

 if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):

这个判断条件按原书上写是为了

如果 $\alpha$ 可以更新进入优化进程

这里主要看 $E_i$ 的公式， $E_i = g(x_i) – y_i$ 。外循环是要找违背KKT条件最严重的样本点(每个样本点对应一个 $\alpha$ )。而在这里主要看的KKT条件是 $0<\alpha_i<C \Longleftrightarrow y_ig(x_i) = 1 \quad (7.112)$
这里判断 $\alpha$ 可以更改进入优化过程的条件写成数学式子是

【 $y_iE_i < -toler$ 且 $\alpha_i<C$ 】或【 $y_i*E_i>toler$ 且 $\alpha_i>C$ 】

条件中

$y_i*E_i = y_i*( g(x_i) – y_i) = y_i* g(x_i) – y_i^2$

由于 $y_i=\pm1$ ，有
$y_i^2 =1$

最后，我们将代码中的原条件化简成

【 $y_i*g(x_i) < 1-toler$ 且 $\alpha_i<C$ 】或【 $y_i*g(x_i)>1+toler$ 且 $\alpha_i>C$ 】

此时重新对比我们所说的的KKT条件

$\Longleftrightarrow yi*g(xi) = 1$

我们要找的就是违背这个条件的 $\alpha$ 与此同时判断这个 $\alpha$ 值不值得更新

可以看出原条件中“或”字前方的方框是属于"小于违背"的情况，后面的方括号是属于"大于违背"的情况。在前面的方括号里我们之所以只需要限定 $\alpha_i <C$ 的条件，而不需要它大于0，是因为我们同时在判断这个alpha值不值得更新。

所谓更新就是要从违背KKT条件的状态更新到不违背KKT的状态。

对于“小于违背”的情况下，由于 $g(x_i) =\sum_{j=1}^N\alpha_jy_jK(x_i,x_j)+b$
也就是， $\alpha_i$ 越大 $g(x_i)$ 越大。在这里我们要更新到不违背KKT的状态，就是需要g(xi)越大。所以判断这个 $\alpha$ 值不值得更新我们只需要判断 $\alpha$ 是否足够小，有继续增大的空间，但是又不能增大到等于C。故有 $\alpha_i<C$ 。而不需要判断 $\alpha_i$ 是否大于0。(其实 $\alpha_i$ 应该肯定会大于等于0，由于 $\boldsymbol\alpha$ 初始化时为全0向量，而后面又有L、H这个机制来保证 $\alpha_i$ 的范围)

第二个判断条件

if eta >= 0: print "eta>=0"; continue

这个判断条件按原书上写

如果eta为0，那么计算新的alpha[j]就比较麻烦了,这里我们就不对此进行详细的介绍

判断 $e t a > = 0$ ,个人感觉其实只需要判断 $e t a = 0$ 就可以了,因为eta是一个完全平方式 $\eta = K_{11}+K_{22}-2K_{12} =\left \| \Phi(x_1)-\Phi(x_2) \right \|^2 \tag{7.107}$
此处数学式子中的 $\eta$ 为李航书中的式子与代码的eta正好是相反数。
判断eta等于0跳出循环的原因是，在后面更新 $\alpha$ 的时候，有公式
$\alpha_2^{new,unc}=\alpha_2^{old}+\frac{y_2(E_1-E_2)}{\eta}$
eta作为分母，不能等于0。

最后，感谢这篇博客https://blog.csdn.net/lyl771857509/article/details/79433184，第一个判断条件主要是看这篇博客的注释得到的启发，另外这是博主的第一篇正式博客，由于博主水平所限，文章中难免有错误和不当之处，欢迎读者给予批评指正，也欢迎大家在评论区讨论提问题

Zehui-Lin

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
《机器学习实战》简化版SMO代码中2个判断条件的思考

《机器学习实战》简化版SMO代码中2个判断条件的思考准备工作公式推导代码判断条件欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML ...
复制链接

扫一扫