【机器学习详解】SVM解回归问题

转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/51121767

CSDN

对于SVM解分类二分类问题,及多分类问题,在上一篇文章已经详述 http://blog.csdn.net/luoshixian099/article/details/51073885。本文将对SVM解回归问题,进行分析。

1.方法分析

在样本数据集 (xn,tn) 中, tn 不是简单的离散值,而是连续值。如在线性回归中,预测房价的问题。与线性回归类似,目标函数是正则平方误差函数:
这里写图片描述
在SVM回归算法中,目的是训练出超平面 y=wTx+b ,采用 yn=wTxn+b 作为预测值。为了获得稀疏解,即计算超平面参数 w,b 不依靠所有样本数据,而是部分数据(如在SVM分类算法中,支持向量的定义),采用 ϵinsensitive 误差函数–Vapnik,1995。
ϵinsensitive 误差函数定义为,如果预测值 yn 与真实值 tn 的差值小于阈值 ϵ 将不对此样本点做惩罚,若超出阈值,惩罚量为 |yntn|ϵ
这里写图片描述
下图为 ϵinsensitive 误差函数与平方误差函数的图形
这里写图片描述

2.目标函数

观察上述的 Eϵ 误差函数的形式,可以看到,实际形成了一个类似管道的样子,在管道中样本点,不做惩罚,所以被称为 ϵtube ,如下图阴影红色部分
这里写图片描述
采用 Eϵ 替代平方误差项,因此可以定义最小化误差函数作为优化目标:
这里写图片描述
由于上述目标函数含有绝对值项不可微。我们可以转化成一个约束优化问题,常用的方法是为每一个样本数据定义两个松弛变量 ξn0,ξn^0 ,表示度量 tn ϵtube 的距离。
如上图所示:
当样本点真实值 tn 位于管道上方时, ξn>0 ,写成表达式: tn>y(xn)+ϵ 时, ξn>0ξ^n=0
当样本点真实值 tn 位于管道下方时, ξn^>0 ,写成表达式: tn<y(xn)ϵ 时, ξn^>0ξn=0
因此使得每个样本点位于管道内部的条件为:
tn 位于管道上方时, ξn>0 ,有 tny(xn)ξnϵ
tn 位于管道下方时, ξn^>0 ,有 y(xn)tnξ^nϵ
误差函数可以写为一个凸二次优化问题:
这里写图片描述
约束条件:
ξn0
ξn^0
tny(xn)ξnϵ
y(xn)tnξ^nϵ
写成拉格朗日函数:
这里写图片描述

3.对偶问题

上述问题为极小极大问题: minw,b,ξn,ξn^ maxμn,μn^,αn,αn^L 与SVM分类分析方法一样,改写成对偶问题 maxμn,μn^,αn,αn^ minw,b,ξn,ξn^L ;首先分别对 w,b,ξn,ξn^ 求偏导数
这里写图片描述
带回到拉格朗日函数中,化简得到只关于 αn,αn^ 的函数,目标即最大化此函数。
这里写图片描述
约束条件为:
0αnC
0αn^C ,其中 k(xn,xm)=(xn)Txm 为向量内积。
下面考虑KKT条件:
这里写图片描述
由式7.65,7.66知:
αn0 时,必有 ϵ+ξn+y(xn)tn=0 ,这些点位于管道上方边界出,或者管道上面。
α^n0 时,必有 ϵ+ξny(xn)+tn=0 ,这些点位于管道下方边界出,或者管道下面。
同时,由式7.65,7.66知,对于任意一个数据点,由于 ϵ>0 ,则 αnα^n 不可能同时不为0,而且得到在管道内部的点,必然有 αn=0α^n=0
这里写图片描述

4.超平面计算:

w 表达式带入到y=wTx+b得:
这里写图片描述
由上述的分析,影响超平面参数的点为位于管道边界处,或者管道外面。
关于b的计算,可以考虑在管道上方边界处一个点必然有:
ξn=0
ϵ+ξn+y(xn)tn=0
联立解出:
这里写图片描述

参考:PRML

  • 16
    点赞
  • 91
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值