datawhale-吃瓜教程(西瓜书+南瓜书)-支持向量机

datawhale-吃瓜教程-支持向量机

Task01:概览西瓜书+南瓜书第1、2章
Task02:详读西瓜书+南瓜书线性模型
Task03:详读西瓜书+南瓜书决策树
Task04:详读西瓜书+南瓜书神经网络
Task05:详读西瓜书+南瓜书支持向量机



一、基本形式


如图6.1,“+”号,“-”号表示不同类别的样本点,将样本点按类别分开的划分超平面可能有很多,我们要寻找的是最优超平面(粗实线),最优超平面对训练样本扰动容忍性好(如果出现更接近分类间隔的样本点,出错的概率小很多,即泛化性能好)。

如图6.2,距离超平面最近的几个训练样本使得等号成立:

使得等式成立的样本点被称为“支持向量”,“+”类和“-”类的两个支持向量到超平面的距离之和为:
γ = 2 ∣ ∣ w ∣ ∣ \frac{2} {||w||} ∣∣w∣∣2
γ被称为间隔。
最大间隔”的划分超平面:寻找满足式中约束的参数wb,使得λ最大。
在这里插入图片描述
最大化间隔
λ*( 2 ∣ ∣ w ∣ ∣ \frac{2}{||w||} ∣∣w∣∣2)仅需最大化||w||-1,等价于最小化||w||2.于是,可重写出支持向量机(SVM)的基本型,即:

二、术语及符号解释

对偶问题:任何一个求极大化的线性规划问题都有一个求极小化的线性规划问题与之对应,反之亦然,如果我们把其中一个叫原问题,则另一个就叫做它的对偶问题,并称这一对互相联系的两个问题为一对对偶问题。
鲁棒性:机器学习中,常用于形容算法模型,当说算法模型具有鲁棒性时,表明对这个算法模型而言,一些异常的数据对整体的性能影响不大或者基本没有影响
泛化能力:算法模型对未知数据的预测能力。
KKT条件:判断==x*==是否为最优解的必要条件。
升维:对于分类问题,有时原始样本空间内不存在一个正确划分两类样本的超平面,如果将原始空间映射到更高维的特征空间,会更容易划分(原始空间有限维,即属性数有限,必然线性可分)。

核技巧:对于高维特征空间,位数很高,带来计算量复杂,甚至无法计算。将高维空间特征的计算结果 通过函数 κ(xi, xj )计算原始空间的属性来得到的技巧。对应的κ(xi, xj )是核函数
希尔伯特空间:完备的内积空间,定义了加法和数乘,距离,内积,具有完备性的空间。希尔伯特空间中的元素一般是函数,因为一个函数可以视为一个无穷维的向量。
“再生核希尔伯特空间”(Reproducing Kernel Hilbert Space,简称 RKHS):我们定义了一种核函数(例如径向基函数),就定义了一个希尔伯特空间,而这个核函数的再生性使得我们可以不去计算高维特征空间中的內积,而只需计算核函数,降低了大量的计算量。
软间隔:允许支持向量机在一些样本上出错。

三、公式推导

在这里插入图片描述

四、反思

对偶问题、软间隔、支持向量回归等公式推导还不是很清楚,比较模糊,后期需要留意这方面知识的学习。

参考文献:
浅谈最优化问题的KKT条件
一片文章带你理解再生核希尔伯特空间(RKHS)以及各种空间
周志华.机器学习[M].北京:清华大学出版社,2016.01
谢文睿 / 秦州. 机器学习公式详解. 北京:人民邮电出版社,2021.03.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
南瓜(《统计学习方法》)是一本机器学习领域的经典教材,被称为机器学习领域的“圣经”。这本由李航教授撰写,包含了机器学习的基本概念、方法和算法等内容。 南瓜主要分为三个部分。第一部分是关于机器学习基础的内容,包括统计学习方法的基本概念、模型评估和选择等内容。第二部分介绍了常用的机器学习算法,如线性模型、决策树、支持向量机等,以及集成学习和聚类方法。第三部分则深入探讨了机器学习中的优化方法、神经网络和深度学习等内容。 该以清晰的逻辑结构和严谨的数学推导,为读者提供了一个系统了解机器学习的方法。同时,该注重实践应用,给出了大量的示例和案例分析,帮助读者理解算法的实际应用场景。 南瓜因其全面而详细的内容,以及对数学推导和算法实现的深入讲解而受到广大学习者的喜爱。对于机器学习初学者来说,这本可以作为入门教材,帮助他们建立起对机器学习基础概念和方法的全面认识。对于已经具备一定机器学习基础的学习者来说,该是一个不可或缺的参考资料,可以帮助他们进一步深入理解和应用机器学习算法。 南瓜的电子版PDF在互联网上广为流传,读者可以通过下载或在线阅读的方式获取。通过阅读南瓜,我们可以更好地掌握机器学习的基本原理和实践技巧,为进一步深入研究和应用机器学习打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值