机器学习(西瓜书)第六章笔记

如果能找到一个超平面,把二分类问题分隔开,则采用拉格朗日结合KKT条件求解该问题

如果不存在这样的超平面可以正确划分该怎么办?

将样本从原始空间映射到一个更高维空间,使得样本在这个特征空间内线性可分,计算过程就是将样本x换成一个向量µ(x)

习题答案:

4.讨论线性判别分析与线性核支持向量机在何种情况下等价。

在线性可分的情况下,LDA求出的wlwl与线性核支持向量机求出的wsws有wl∗ws=0wl∗ws=0,即垂直,此时两者是等价的。

当初在做这个题的时候也没细想,就想当然的认为在线性可分时两者求出来的w会垂直,现在看来并不一定。

首先,如果可以使用软间隔的线性SVM,其实线性可分这个条件是不必要的,如果是硬间隔线性SVM,那么线性可分是必要条件。这个题只说了是线性SVM,就没必要关心数据是不是可分,毕竟LDA是都可以处理的。

第二,假如当前样本线性可分,且SVM与LDA求出的结果相互垂直。当SVM的支持向量固定时,再加入新的样本,并不会改变求出的w,但是新加入的样本会改变原类型数据的协方差和均值,从而导致LDA求出的结果发生改变。这个时候两者的w就不垂直了,但是数据依然是可分的。所以我上面说的垂直是有问题的。

我认为这个题的答案应该就是,当线性SVM和LDA求出的w互相垂直时,两者是等价的,SVM这个时候也就比LDA多了个偏移b而已。

5.试述高斯核SVMRBF神经网络的联系

RBF网络的径向基函数与SVM都可以采用高斯核,也就分别得到了高斯核RBF网络与高斯核SVM。

神经网络是最小化累计误差,将参数作为惩罚项,而SVM相反,主要是最小化参数,将误差作为惩罚项。

在二分类问题中,如果将RBF中隐层数为样本个数,且每个样本中心就是样本参数,得出的RBF网络与核SVM基本等价,非支持向量将得到很小的ww.

使用LIBSVM对异或问题训练一个高斯核SVM得到αα,修改第5章RBF网络的代码,固定ββ参数为高斯核SVM的参数,修改每个隐层神经元的中心为各个输入参数,得到结果ww,w与αw与α各项成正比例。

6.试析SVM对噪声敏感的原因。

SVM的目的是求出与支持向量有最大化距离的直线,以每个样本为圆心,该距离为半径做圆,可以近似认为圆内的点与该样本属于相同分类。如果出现了噪声,那么这个噪声所带来的错误分类也将最大化,所以SVM对噪声是很敏感的。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值