机器学习技法-01-1-Course Introduction

本文探讨了线性支持向量机的概念,强调了如何通过最大间隔选择最优超平面。在 PLA 中,虽然每次选择是随机的,但从 VC 维角度看,不同超平面并无优劣之分。文章提出,理想的超平面应远离所有训练样本点,以确保即使存在测量误差,测试数据也能得到正确的预测。此外,引入了 fat hyperplane 和 largest-margin separating hyperplane 的概念,后者需要同时完美分离所有点并具有最大间隔。
摘要由CSDN通过智能技术生成

线性支持向量机

PLA在之前的课程中很难对每一条hyperplane进行具体的优劣比较,是借助dichotomy将无限的问题转换成了有限的问题。

那么到底哪一条线比较好呢?


PLA? 每一次的选择都是随机的,VC bound的角度来说,下面的三种情况并没有区别。

想象已经有了原始资料xn,就是被hyperplane完美分开的那些点,测试的时候拿到和xn很相近的数据(因为总会存在一些测量错误)x约等于xn。x是测试资料,xn是训练资料。

最好的预测结果:和训练资料相近的测试资料预测的结果是相同的。

也就是在训练集数据周围的灰色区域内的测试数据,也能得到和训练集一样的预测结果。


1.xn与hyperplane距离比较远时,就算测试资料有很大的测量误差也能得到和训练资料相同的结果;

2.xn与hyperplane距离比较近时,测试资料稍微有一点测量误差,就会被划分到对立的区域中去。

结论:hyperplane要离每一个xn越远越好。


除了刚才的距离来判断是否稳健,也可以使用fat hyperplane来衡量!

fat hyperplane:hyperplane到离得最近的xn的灰色区域,越宽越稳健。


largest-margin separating hyperplane需要满足两点:

1.找到的hyperplane必须可以完美地把所有的点都分开;

2.largest-margin


hyperplane必须在“+1”和“-1”之间的垂直平分线,也就是中垂线。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值