斯坦福大学公开课机器学习课程(Andrew Ng)七最优间隔分类器

课程概要:

1.最优间隔分类器

2.原始/对偶问题

3.svm的对偶问题

    在上篇中,我们提到了函数间隔与几何间隔,这两个定义是 svm 的基本定义,因为svn比较复杂,这里先简要介绍一下svn的几个部分。首先是函数间隔与几何间隔,由它们
引出最优间隔分类器;为了多快好的解决最优间隔分类器问题,使用了拉格朗日对偶性性质,于是,先要理解原始优化问题与对偶问题及它们在什么条件(KKT 条件)下最优解等价,然后写出最优间隔分类器的对偶形式;通过对最优间隔分类器对偶问题求解,发现求解时目标函数中存在内积形式的计算,据此引入了核技法;引入核技法后就得到了完完全全的 svm求解问题,使用序列最小化算法(SMO)进行求解。这就是公开课中对svm的全部介绍,这里先写出来有个大致的了解。


一、最优间隔分类器


      在开始之前,仍然要强调一下本篇所讲的内容仍然是假设数据集是线性可分的。 首先,回顾一下讲述函数间隔时对目标函数的表示方法所做的变化:
类别y可取值由{0,1}变为{-1,1},假设函数变为:

由公式2,我们得知,w,b可以唯一的确定一个超平面。
回顾一下上篇笔记中介绍的函数间隔的缺点,只要成倍的增大 w,b,就可以使函数间隔
变大。而几何间隔不会遇到这个问题,究其原因,是成倍增大 w,b后,决策面的位置不会发
生改变。本节会利用这个性质,对 w,b进行缩放,从而简化问题。
最优间隔分类器(optimal margin classifier),是指在对数据分类时,得到的决策面的一
个性质,即决策面距离数据点的几何间隔最大。可以使用置信度对它来进行解释,对于线性
可分数据,我们可以得到无数个决策面,直观上看,数据点距离决策面越远,决策面对数据
点的预测可信度就越高。最优间隔分类器即是寻找一个决策面,使之对数据点的预测的置信
度达到最高(即找到一个离数据点最远的决策面)。最优间隔分类器可以看做是支撑向量机的前身,是一种学习算法

通过选择特定的wb,使几何间隔最大化(离数据点最远即为使集合间隔最大)。

使用数学语言描述即为:

上式的含义是通过改变w,b,寻找一个最大的γ值,使得对于训练集中所有的点,点到决策面的几何距离都大于γ
其中, ||w||=1保证了目标值是几何间隔。但是这个约束本身是一个非常糟糕的非凸性约束。要求解的参数w在一个球体表面,如果想得到一个凸优化问题,必须保证如梯度下降算法这种局部最优值搜索算法不会找到局部最优值,而非凸性约束不能满足这个条件,所以需要改变优化问题。

为了解决上述问题,提出下面的最优化问题:


上述两式描述的是同一个问题,即寻找一个最大的值(几何间隔),使得训练集中所有的点到决策面的几何距离(函数间隔)都大于该值。上式通过将非凸性的约束条件转移到目标函数中,使问题变成凸性问题。

对于上式,还可以再做一次变换,使之更为简单。我们知道,等比例对 w,b 进行缩放,不会改变决策面的位置。假设已经得到 w,b,那么就能求出

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习-面向视觉识别的卷积神经网络,2016斯坦福大学公开课课程介绍: 计算机视觉在社会中已经逐渐普及,并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。而这些应用的核心技术就是图像分类、图像定位和图像探测等视觉识别任务。近期神经网络(也就是“深度学习”)方法上的进展极大地提升了这些代表当前发展水平的视觉识别系统的性能。 本课程将深入讲解深度学习框架的细节问题,聚焦面向视觉识别任务(尤其是图像分类任务)的端到端学习模型。在10周的课程中,学生们将会学习如何实现、训练和调试他们自己的神经网络,并建立起对计算机视觉领域的前沿研究方向的细节理解。最终的作业将包括训练一个有几百万参数的卷积神经网络,并将其应用到最大的图像分类数据库(ImageNet)上。我们将会聚焦于教授如何确定图像识别问题,学习算法(比如反向传播算法),对网络的训练和精细调整(fine-tuning)中的工程实践技巧,指导学生动手完成课程作业和最终的课程项目。本课程的大部分背景知识和素材都来源于ImageNet Challenge竞赛。 主讲人: 李飞飞,斯坦福大学计算机科学系副教授。担任斯坦福大学人工智能实验室和视觉实验室主任,主要研究方向为机器学习、计算机视觉、认知计算神经学。她在TED上的演讲,如何教计算机理解图片。
斯坦福大学机器学习的数学基础.pdf》是一本由斯坦福大学开发的机器学习教材。本书将数学基础与机器学习算法相结合,旨在向读者介绍机器学习所需的数学知识。 该书首先介绍了线性代数的基础知识。线性代数是机器学习中常用的工具,被广泛应用于数据处理和模型训练中。本书从向量、矩阵和线性变换等基本概念开始,逐步讲解了线性方程组、行列式、特征值与特征向量等重要内容,为读者提供了深入理解线性代数的基础。 接着,本书介绍了概率论和统计学的相关知识。概率论是机器学习的核心概念之一,它用于描述和解释不确定性。统计学是机器学习中的重要工具,利用统计方法对数据进行分析和建模。本书讲解了概率论的基本概念、条件概率和贝叶斯定理等内容,同时介绍了统计学中的假设检验、参数估计和回归分析等方法。 最后,本书还介绍了线性回归、逻辑回归、支持向量机等常用的机器学习算法。这些算法建立在数学基础之上,通过数学模型实现对数据的学习和预测。本书通过具体的案例分析和实践操作,让读者理解这些算法的原理和实际应用。 总之,《斯坦福大学机器学习的数学基础.pdf》是一本系统而全面的机器学习教材,涵盖了机器学习所需的数学基础知识。读者通过学习本书,将能够理解和应用机器学习算法,从而在实际问题中进行数据分析和模型构建。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值