ML10自学笔记-SVM

SVM(分类问题)

在这里插入图片描述

SVM 推导

想要两类之间最大间隔
在这里插入图片描述
要计算距离。假设决策边界是这样一个平面,那就是计算这个点到直线的距离。
平面的定义:WTX=b。WT为法向量。我们要算的就是dist(x,h),但是直接计算比较麻烦,通常情况下这样计算。
找平面内两个点x 和x’’,可以将这两个点带入平面公式,两个点组成一个向量,dist这个向量与x 和x’’组成的向量垂直。如②式子,法向量与平面内任意一个向量垂直。
因为计算直线距离不好计算,所以改为计算两点之间的距离,可以计算X与X之间的距离然后在竖直方向做投影就可以得到dist(x,h),如最后一行的公式。后面一个等号进行化简,将X用①公式代入。
在这里插入图片描述

数据

y(xi)是预测值,Yi是标签值。
在这里插入图片描述

目标函数

原来距离为|wtx+b|,是带着绝对值的,但是之前的决策方程中y(xi)与yi的乘积始终是正数,所以在本节的式子中相乘之后可以直接把绝对值去掉。
在这里插入图片描述
min后面是要求的距离决策边界最近的点(样本),求出这个距离,max是最大的距离,使得刚刚这个求得的距离最大。目标即什么样的w使得这个目标函数最大。
在这里插入图片描述

目标函数求解

实际为求w的最小值。因为求w和w2的最小值是一样的,所以求1/2w2的最小值也是一样的。
在这里插入图片描述
使用拉格朗日乘子法求解。
在这里插入图片描述
有一个对偶性质。要求最小值,就可以求偏导。
在这里插入图片描述
什么样的w,b使得L最小,然后把w,b代回原式子
在这里插入图片描述
下一步,求什么样的αi使得整体最大。通常情况下会把求极大值转化成极小值(加了负号)。
在这里插入图片描述
SVM求解实例

在这里插入图片描述
括号内点乘是内积。即代入数据。
在这里插入图片描述
求解,求偏导。因为所有αi,都要大于零(约束条件),但是当对α2求偏导等于零时,求得的值为复数,所以最值在边界上,令α1和α2分别取零。第二种满足,可以根据之前的式子求得α3.
在这里插入图片描述
带回w求解。对于样本点来说,只要α为零了,那他就没有意义了,不会再加入计算,根据之前的图像,x2就不会算入计算式子了,最终的结果是由边界上的样本构成的,所以x2非边界上的点不算入计算式子。
在这里插入图片描述

软间隔

在这里插入图片描述
目标函数也发生了变化。
在这里插入图片描述

多加了参数。
在这里插入图片描述

核变换

之前是线性的,没有使用Φ(x)函数,只是用了简单的x,
在这里插入图片描述

因为映射到高维有时候很难计算,先映射到高维,高维多个数据求内积比较麻烦,但是通过先求内积再映射的方式,先求内积,然后再映射可以达到同样的效果,但是计算复杂度降低。
在这里插入图片描述
没有做核函数时,分类不太好(那条实线),使用高斯核函数后分类较好,圈圈。核函数就是将低维不可分,转换为高维可分。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值