机器学习-学习笔记 支持向量机

支持向量机

间隔与支持向量

这里写图片描述

划分超平面可通过如下线性方程来描述:

这里写图片描述

下图中的等式称为支持向量,二个等式之间的距离称为间隔。

这里写图片描述

目的就是找到最大间隔的划分超平面。
这里写图片描述

对偶问题

这里写图片描述
由上述式子可以得到对偶问题
这里写图片描述

最终得到如下公式

满足条件
这里写图片描述

核函数

异或问题就不是线性可分的。
这里写图片描述

核函数,支持向量展式
这里写图片描述

核函数定理

支持向量机 通过某非线性变换 φ( x) ,将输入空间映射到高维特征空间。特征空间的维数可能非常高。如果支持向量机的求解只用到内积运算,而在低维输入空间又存在某个函数 K(x, x′) ,它恰好等于在高维空间中这个内积,即K( x, x′) =<φ( x) ⋅φ( x′) > 。那么支持向量机就不用计算复杂的非线性变换,而由这个函数 K(x, x′) 直接得到非线性变换的内积,使大大简化了计算。这样的函数 K(x, x′) 称为核函数。

这里写图片描述

软间隔与正则化

为了缓解过拟合问题,引入软间隔的概念。
这里写图片描述

前面介绍的间隔为硬间隔,即所有样本都必须划分正确,而软间隔则允许有特例。

这里写图片描述

在最大化间隔的同时,不满足约束的样本应该尽可能的少,所以,优化目标可写成
这里写图片描述

人们通常使用一些其他函数来代替上述中的l,称为替代损失。
通常有以下三种
这里写图片描述

这里写图片描述

软间隔支持向量机(hinge损失)

这里写图片描述

接着引入松弛变量

这里写图片描述

得到的对偶问题

这里写图片描述

KKT条件
这里写图片描述

得出,软间隔支持向量机的最终模型仅与支持向量有关,即hinge损失函数仍然保持了稀疏性。

正则化

这里写图片描述

概念
这里写图片描述

支持向量回归(SVR)

就是通过一定的差值判断,而不是以前的必须完全相同才算正确的样例。
这里写图片描述

问题形式化:

这里写图片描述
其中的不敏感损失函数
这里写图片描述
引入松弛变量

这里写图片描述

最后可得
这里写图片描述

若考虑特征映射形式
这里写图片描述

核方法

定理

这里写图片描述

何为核方法
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值