线性最小二乘回归和核岭回归

一般线性回归最小二乘法推导

原理,求平方误差最小
假设有k个观测值 Xi , Yi ,有关系 Y=f(X|θ) ,其中 θ=(θ1,θ2,...,θl)
平方误差和为:

Λ=12i=1k[f(Xi|θ)Yi]2

要求误差平方和关于 θ 的函数在极值点前后接近单调
Λθj=i=1k[f(Xi|θ)Yi]f(Xi|θ)θj

一般情况各参数之间是线性关系,以二项式为例,
f(Xi|θ)==θ1+θ2Xi+θ3X2i+...+θlXl1ij=1lθjXj1i

带入上式,得
Λθj=i=1k[j=1lθjXj1iYi]Xj1i

显然多项式关于参数的函数是开口向上的二次函数,是满足极值条件的,令导数为零,则零点即为最小值点
多参数联立,有:
Λθ1Λθ2Λθl===i=1k[j=1lθjXj1iYi]X0ii=1k[j=1lθjXj1iYi]X1ii=1k[j=1lθjXj1iYi]Xl1i===000

整理得:
θ1i=1kX0iθ1i=1kX1iθ1i=1kXl1i+++θ2i=1kX1iθ2i=1kX2iθ2i=1kXli+++.........+++θli=1kXl1iθli=1kXliθli=1kX2l2ii=1kYiX0ii=1kYiX1ii=1kYiXl1i===000

写成矩阵形式:
i=1kX0ii=1kX1ii=1kXl1ii=1kX1ii=1kX2ii=1kXlii=1kXl1ii=1kXlii=1kX2l2iθ1θ2θl=i=1kYiX0ii=1kYiX1ii=1kYiXl1i

可以得:
i=1kX0iX1iXl1iX1iX2iXliXl1iXliX2l2iθ1θ2θl=i=1kYiX0iYiX1iYiXl1i

假设k=1,即只有一组观测值有:
X0iX1iXl1iX1iX2iXliXl1iXliX2l2iθ1θ2θl=YiX0iYiX1iYiXl1i==>[X0iX1iXl1i]θ1θ2θl=[Yi]
对所有的观测值都成立,由每一组观测值得出的方程,有
X01X02X0kX11X12X1kXl11Xl12Xl1kθ1θ2θl=Y1Y2Yk

即:
Xk×lθl×1=Yk×1XTl×kXk×lθl×1=XTl×kYk×1θl×1=(XTl×kXk×l)1XTl×kYk×1

假设 X Y分别为m和n维的向量(一般 m>=n ),模型采用一阶线性回归,则可直接由上面的方法得到:

X11X12X1kX21X22X2kXm1Xm2Xmkθ11θ12θ1mθ21θ22θ2mθn1θn2θnm=Y11Y12Y1kY21Y22Y2kYn1Yn2Ynk

即:
Xk×mθm×n=Yk×nXTm×kXk×mθm×n=XTm×kYk×nθm×n=(XTm×kXk×m)1XTm×kYk×n

对偶表达
θm×n=XTm×kXk×m(XTm×kXk×m)2XTm×kYk×n=XTm×kαk×n

岭回归和核技巧

在上面的基础上,当 k<m 的时候,即样本数不足的情况下,在求逆的时候会发生问题,此时在求逆时减去一个 λI 来使得求逆可行

θm×n=(XTm×kXk×mλIm×m)1XTm×kYk×n(XTm×kXk×mλIm×m)θm×n=XTm×kYk×nXTm×kXk×mθm×nλIm×mθm×n=XTm×kYk×nλθm×n=XTm×kXk×mθm×nXTm×kYk×nθm×n=λ1XTm×k(Xk×mθm×nYk×n)=XTm×kαk×n

αk×n=λ1(Xk×mθm×nYk×n)==>λαk×n=Xk×mXTm×kαk×nYk×n==>(Xk×mXTm×kλIk×k)αk×n=Yk×n==>αk×n=(Xk×mXTm×kλIk×k)1Yk×n

遇到不可线性回归的情况,考虑核方法,由于预测时并不用求出具体的值,假设预测时有q组观测值,则预测值 Ypq×n ,在线性条件下有

Ypq×n=Xpq×mθm×n=Xpq×mXTm×k(Xk×mXTm×kλIk×k)1Yk×n

变换到这个等式,形成了训练集的內积,就可以使用核技巧了.
定义核函数 K(X1,X2)=<Φ(X1),Φ(X2)> ,其中 Φ 为空间变换函数,不需要指明.

Ypq×n=K(Xp1,X1)K(Xp2,X1)K(Xpq,X1)K(Xp1,X2)K(Xp2,X2)K(Xpq,X2)K(Xp1,Xk)K(Xp2,Xk)K(Xpq,Xk)K(X1,X1)K(X2,X1)K(Xk,X1)K(X1,X2)K(X2,X2)K(Xk,X2)K(X1,Xk)K(X2,Xk)K(Xk,Xk)λIk×kYk×n

核岭回归适用于解决小样本的非线性回归问题,随着问题规模的扩大不再适用,而且抗噪声能力不强,多用于手机定位的计算

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值