20170123 Coursera Stanford-MachineLearning/Week7

Week7:Support Vector Machine(SVM) 支持向量机

SVM又称为大间距分类器(Large Margin Classifier)

SVM以及其目标函数


cost1(θTx(i))=loghθ(x(i))

cost0(θTx(i))=log(1hθ(x(i)))

与逻辑回归不同的是把 1m 这个常数项舍去,因为其对最后的结果(即代价函数取 min θ 的值)没有影响
而且令 C=1λ


这就是SVM的数学表达式,Cost函数不一定就是 log 那种类型的


为了使 min 函数前面一项为0,须有 θTx(i)1 if y(i)=1 θTx(i)1 if y(i)=0
这样就有SVM函数 minθ12j=1nθ2j


注意margin(一般取1,即 θTx1 θTx1 中的1和-1),而且一般是有方向性的,即线的一边为y=1,线的一边为y=0

SVM的数学原理


对于 θTx(i) 可以认为是范数 ||θ|| 和投影 p(i) 的乘积


对于上图中的绿色线为SVM决策边界,蓝色线 θ 向量的方向与决策边界垂直
对于上图中的左下图

p(1)||θ||1p(1)||θ||

p(2) 同理
这个时候说明这个决策边界选择不合适,我们要实现的应该是使得 p(i) 更大,令 ||θ|| 更小
对于上图中的右下图
Margin其实就是训练样本到决策边界的距离,其实也就是 p(i)
对于SVM,它产生Large Margin的原因在于选择了最合适的决策边界使得 p(i) 极大化,进而极小化 ||θ|| ,这也是SVM中最小化目标函数 12j=1nθ2j 的意义所在

Kernels核函数


上图中是非线性决策边界

K(x,l(i)) 称为核函数
在下图中为高斯核函数

Gaussian Kernel:高斯核函数

fi=exp(||xl(i)||22σ2),where l(i)=x(i)Need to choose σ2


最高点函数的值必为1

下图中 f1 f2 f3 的定义均与上图类似,本质上是 fi=similarity(x,l(i))

对于上图中靠近 l(1) l(2) 的点,根据 fi θi 的值预测结果为y=1,对于远离 l(1) l(2) 的点预测结果为y=0
所以我们可以用landmark标记点和KernelsFunction核函数来训练出非常复杂的非线性边界

f(i) 是一个特征向量,与 x(i) 有关

使用Kernel的时候将cost函数中的 θTx(i) 替换为 θTf(i) ,然后根据Kernel修改正则项为 θTMθ ,M取决于Kernel,以用更高计算效率适应超大训练集。
但是需要提到的一点是,如果把逻辑回归和Kernel结合,那运行效率很低

SVM参数选择

No Kernel(“linear Kernel”)为 θTx

使用Linear Kernel的时候一般是x的变量数多但是样本总数少
使用Gaussian Kernel的时候一般是x的变量数少但是样本总数多

不是所有的SimilarityFunction similarity(x,l) 是有效的Kernel,必须遵循Mercer’s Theorem ,使SVM正确地收敛
一般用的比较多的Kernel是高斯和线性,但也有其他的一些例如
* PolynomialKernel (xT+constant)degree
* String Kernel
* chi-square Kernel
* histogram intersection kernel
* …

Multi-class classification

可以用one-vs.-all method(用对K个类用K个SVM然后每个类用一个SVM)
或者使用SVM包内置的多类别分类器

逻辑回归 vs. SVMs

逻辑回归 与 SVM without Kernel 是十分相似的算法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值