【斯坦福---机器学习】复习笔记之顺序最小优化算法

最新推荐文章于 2024-02-06 00:27:08 发布

Andrewseu

最新推荐文章于 2024-02-06 00:27:08 发布

阅读量4.1k

点赞数 2

分类专栏： MachineLearning 文章标签：机器学习核 SMO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Andrewseu/article/details/48443633

版权

MachineLearning 专栏收录该内容

22 篇文章 4 订阅

订阅专栏

本讲大纲：

1.核（kernels）
2.软边界（soft margin）
3.SMO算法（SMO algorithm）

1.核

属性（attributes）:原始的输入值（房价的例子中，x，住房的面积）
特征（features）：由原始数据映射的一些数据
用这里写图片描述来表示特征映射，例如：

用代替x.
定义核为：
是很容易计算的，即使计算的代价很大（高维向量）. 在这种设定中，在算法中用一个很高效的方法计算，我们可以让SVM在高维特征中学习，而不用显示的表示出这里写图片描述 .

假设这里写图片描述，

可以写成，
以n=3为例，

直观上来说，如果这里写图片描述和很近，我们可能认为很大，相反，如果很远–几近正交，则很小. 因此，我们可以认为可以看作是和相似度的一种测量. 例如，或许选择，，这是一种合理的测量方法，当x和z很近时值接近于1，很远时值接近0. 在特定的例子中是可以作为SVM的核的. （这个核叫做高斯核 Gaussian kernel,映射到一个无限维的特征）

定理（Mercer）:给定K，这里写图片描述是给定的，对于一个确定的核，它的充分必要条件是相应的核矩阵式对称半正定的.

利用核的例子：
数字的识别,分类字符

2.软边界

正则化和不可分的例子（regularization and the non-separable case）
到目前为止，我们讨论SVM时认为数据是线性可分的, 把数据映射到高维空间一般会增加线性可分的可能性，但是我们不能保证一定可以.

左图显示的是一个最优间隔分类器，但是如果在左上区域加上一个异常值，决定边界线会发生剧烈的变化，
导致分类器有更小的边界.
这里写图片描述

为了使算法能够处理非线性可分的数据集并且对异常值不会这么敏感, 修订优化问题如下：
这里写图片描述

因此，样本现在允许边界小于1.

3.SMO算法

SMO（sequential minimal optimization）算法起源于SVM, John Platt起初了一个高效解决对偶问题的方法.

坐标上升（Coordinate ascend）
对于没有限制的优化问题：
这里写图片描述，除了用梯度上升和牛顿方法，还能使用坐标上升算法：

下图是坐标上升执行的一个过程：

这是我们要解决的对偶问题：
这里写图片描述

这里不能直接使用坐标上升算法，因此（19）的限制. 因此我们至少要同时改变两个才能满足限制. 因此：
这里写图片描述

SMO算法之所以高效是能够很高效的计算出ai,aj.

以改变a1,a2为例，这里写图片描述（常数），a1、a2的限制如下图所示：

得到：

之后计算出a1的值.

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
【斯坦福---机器学习】复习笔记之顺序最小优化算法

本讲大纲：1.核（kernels） 2.软边界（soft margin） 3.SMO算法（SMO algorithm）1.核属性（attributes）:原始的输入值（房价的例子中，x，住房的面积）特征（features）：由原始数据映射的一些数据用来表示特征映射，例如：用代替x. 定义核为：是很容易计算的，即使计算的代价很大（高维向量）. 在这种设定中，在算法中用一个很高
复制链接

扫一扫

专栏目录

Andrewseu CSDN认证博客专家 CSDN认证企业博客

码龄12年

182: 原创

13万+: 周排名

129万+: 总排名

63万+: 访问

: 等级

7398: 积分

332: 粉丝

153: 获赞

171: 评论

401: 收藏

私信

关注

热门文章

分类专栏

MachineLearning 22篇
DeepLearning 22篇
Data Stucture 7篇
LeetCode 51篇
C++ 18篇
Python 15篇
ComputerVision 22篇
Matlab 1篇
Thinking 10篇
Linux 8篇
JSP 2篇
Resource 1篇
Compiler 1篇
Interview 5篇
PHP 1篇
Algorithm 6篇
IDE 1篇
LittleSkills 3篇
PAT 29篇
DesignPattern 1篇
Maya 7篇

最新评论

图像情感识别
MIURA临: 博主好，最近在学习图像情感识别，请问能否参考一下您的源码，我的邮箱为[email protected]，万分感谢
图像情感识别
zasipiypz: 博主好，最近在学习图像情感识别，请问能否参考一下您的源码，我的邮箱为[email protected]，万分感谢
图像情感识别
JKTYK: 博主好，最近在学习图像情感识别，请问能否参考一下您的源码，我的邮箱为[email protected]，万分感谢！
图像情感识别
会写代码的小狗: 博主你好，最近在做大创的项目，关于是自闭症患者的，想向您要一份源码，我的邮箱为[email protected],谢谢您
子集法NFA转DFA
frostxxx: 谢谢大佬解决了我的问题！！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。