【机器学习】SVR支持向量机回归

回归和分类从某种意义上讲,本质上是一回事。SVM分类,就是找到一个平面,让两个分类集合的支持向量或者所有的数据(LSSVM)离分类平面最远;SVR回归,就是找到一个回归平面,让一个集合的所有数据到该平面的距离最近。 

  我们来推导一下SVR。根据支持向量机二分类博客所述,数据集合归一化后,某个元素到回归平面的距离为r=d(x)g(x)r=d(x)−g(x)。另外,由于数据不可能都在回归平面上,距离之和还是挺大,因此所有数据到回归平面的距离可以给定一个容忍值ε防止过拟合。该参数是经验参数,需要人工给定。如果数据元素到回归平面的距离小于ε,则代价为0。SVR的代价函数可以表示为:

cost(x)=max(0,|d(x)g(x)|ε)cost(x)=max(0,|d(x)−g(x)|−ε)

其中d是标准答案。考虑松弛变量 ξi,ξiξi,ξi∗,分别代表上下边界的松弛因子。有约束条件: 
{d(xi)g(xi)<ε+ξi,ξi0g(xi)d(xi)<ε+ξi,ξi0{d(xi)−g(xi)<ε+ξi,ξi≥0g(xi)−d(xi)<ε+ξi∗,ξi∗≥0

我们实际上是要最小化 ξi,ξiξi,ξi∗。我们为了获得w的稀疏解,且假设w的计算结果满足正态分布,根据贝叶斯线性回归模型,对w有L2范数约束。 
  SVR可以转变为最优化问题: 
Φ(x)=i(ξi+ξi)+12CwTwΦ(x)=Ci(ξi+ξi)+12wTwΦ(x)=∑i(ξi+ξi∗)+12C′wTw→Φ(x)=C∑i(ξi+ξi∗)+12wTw

其中C是惩罚因子,是人为给定的经验参数。考虑约束条件,引入拉格朗日算子 α,α,β,βα,α∗,β,β∗,将最优化问题转化为对偶问题: 
J=12wTw+Ci(ξi+ξi)+iαi[d(xi)g(xi)εξi]+iαi[g(xi)d(xi)εξi]iβiξiiβiξiJ=12wTw+C∑i(ξi+ξi∗)+∑iαi[d(xi)−g(xi)−ε−ξi]+∑iαi∗[g(xi)−d(xi)−ε−ξi∗]−∑iβiξi−∑iβi∗ξi∗

然后分别求导得到: 
Jw=w(iαixiiαixi)=0Jb=i(αiαi)=0Jξi=Cαiβi=0Jξi=Cαiβi=0C=αi+βi=αi+βi∂J∂w=w−(∑iαixi−∑iαi∗xi)=0∂J∂b=∑i(αi−αi∗)=0∂J∂ξi=C−αi−βi=0∂J∂ξi∗=C−αi∗−βi∗=0C=αi+βi=αi∗+βi∗

  将上述式子代入J函数有: 

J=12wTwi(αiαi)wxibi(αiαi)i(αi+αi)ε+i(αiαi)d(xi)+Ci(ξi+ξi)iαiξiiαiξii(Cαi)ξii(Cαi)ξi=12(iαixiiαixi)(jαjxjjαjxj)(iαixiiαixi)(jαjxjjαjxj)i(αi+αi)ε+i(αiαi)d(xi)=12ij(αiαi)(αjαj)xixji(αi+αi)ε+i(αiαi)d(xi)subject to 0αi,αiCJ=12wTw−∑i(αi−αi∗)wxi−b∑i(αi−αi∗)−∑i(αi+αi∗)ε+∑i(αi−αi∗)d(xi)+C∑i(ξi+ξi∗)−∑iαiξi−∑iαi∗ξi∗−∑i(C−αi)ξi−∑i(C−αi∗)ξi∗=12(∑iαixi−∑iαi∗xi)(∑jαjxj−∑jαj∗xj)−(∑iαixi−∑iαi∗xi)(∑jαjxj−∑jαj∗xj)−∑i(αi+αi∗)ε+∑i(αi−αi∗)d(xi)=−12∑i∑j(αi−αi∗)(αj−αj∗)xixj−∑i(αi+αi∗)ε+∑i(αi−αi∗)d(xi)subject to 0≤αi,αi∗≤C

其中 ξ,ξ,β,βξ,ξ∗,β,β∗都在计算过程中抵消了,非常神奇。 ε,Cε,C则是人为给定的参数,是常量。如果要使用核函数,可以将上式写成:
J=12ij(αiαi)(αjαj)k(xixj)i(αi+αi)ε+i(αiαi)d(xi)J=−12∑i∑j(αi−αi∗)(αj−αj∗)k(xixj)−∑i(αi+αi∗)ε+∑i(αi−αi∗)d(xi)

  SVR的代价函数和SVM的很相似,但是最优化的对象却不同,对偶式有很大不同,解法同样都是基于拉格朗日的最优化问题解法。求解这类问题的早期解法非常复杂,后来出来很多新的较为简单的解法,对数学和编程水平要求高,对大部分工程学人士来说还是颇为复杂和难以实现,因此大牛们推出了一些SVM库。比较出名的有libSVM,该库同时实现了SVM和SVR。 
  我们来看一个简单的例子,数据为[-5.0,9.0]的随机数组,函数为 y=12x2+3x+5+noisey=12x2+3x+5+noise,我分别使用三种核SVR:两种惩罚系数rbf和一种poly。结果如下: 
  

from sklearn import svm
import numpy as np
from matplotlib import pyplot as plt 

X = np.arange(-5.,9.,0.1)
X=np.random.permutation(X)
X_=[[i] for i in X]
#print X
b=5.
y=0.5 * X ** 2.0 +3. * X + b + np.random.random(X.shape)* 10.
y_=[i for i in y]

rbf1=svm.SVR(kernel='rbf',C=1, )#degree=2,,gamma=, coef0=
rbf2=svm.SVR(kernel='rbf',C=20, )#degree=2,,gamma=, coef0=
poly=svm.SVR(kernel='poly',C=1,degree=2)
rbf1.fit(X_,y_)
rbf2.fit(X_,y_)
poly.fit(X_,y_)
result1 = rbf1.predict(X_)
result2 = rbf2.predict(X_)
result3 = poly.predict(X_)
plt.hold(True)
plt.plot(X,y,'bo',fillstyle='none')
plt.plot(X,result1,'r.')
plt.plot(X,result2,'g.')
plt.plot(X,result3,'c.')
plt.show()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27

这里写图片描述 
蓝色是poly,红色是c=1的rbf,绿色是c=20的rbf。其中效果最好的是c=20的rbf。如果我们知道函数的表达式,线性规划的效果更好,但是大部分情况下我们不知道数据的函数表达式,因此只能慢慢试验,SVM的作用就在这里了。就我来看,SVR的回归效果不如神经网络。 

转载:https://blog.csdn.net/lpsl1882/article/details/52411987

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值