多元线性回归

一、线性模型

x1 x2 是两个标量或维数相同的变量, α β为任意标量,则称 αx1+βx2 x1 x2 的线性组合。若 f x的线性函数,则有

f(αx1+βx2)=αf(x1)+βf(x2)
特别地,当 α=1β 时, αx1+βx2 x1 x2 的加权平均,而 f 的线性性质决定了加权平均的函数值等于各函数值的加权平均。
x=(x1,...,xn)为向量,而 f(x) 为标量,则 f 的形式为:
f(x)=a+b1x1+...+bnxn=a+bx
其中, b=(b1,...,bn)
线性模型可用于任何预测任务,包括分类、概率估计和回归。

二、多元线性回归

在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。
多元线性回归的方程如下:

y=h(x)=hθ(x)=θ0+θ1x1+...+θnxn
其中, θ=(θ0,θ1,...,θn) 就是方程的回归系数。
假设 (x1i,x2i,...,xni;yi),i=(1,2,...,m) ,为m组样本,在该样本下,回归方程的方程组形式如下:
y1=θ0+θ1x11+θ2x21+...+θnxn1y2=θ0+θ1x12+θ2x22+...+θnxn2...ym=θ0+θ1x1m+θ2x2m+...+θnxnm

利用矩阵运算,可表示为:
y1y2yn=111x11x12x1mxn1xn2xnmθ0θ1θn

y=y1y2yn
X=111x11x12x1mxn1xn2xnm
θ=θ0θ1θn
则在该组样本下,回归模型的矩阵表示为:
hθ(x)=θTX
这里 x0=1

三、损失函数

损失函数是用来估量模型的预测值 h(x) 与真实值 Y 的不一致程度,它是一个非负实值函数,损失函数越小,模型的鲁棒性就越好。定义回归函数和实际值之间差的均方和为损失函数:

J(θ)=12mi=1m(hθ(x(i)y(i))2
m为样本数量,我们的目的是求出使损失函数 J(θ) 最小的参数 θ 的值。

1.梯度下降法

θ是包含所有参数的一维向量,我们先初始化一个 θ ,在这个θ值之上,用梯度下降法去求出下一组 θ 的值,由于是梯度下降的,所以损失函数J(θ)的值在下降。当迭代到一定程度, J(θ) 的值趋于稳定,此时的 θ 即为要求得的值。
方法如下:
(1)先确定向下一步的步伐大小,即α;
(2)任意给定一个初始值:θ;
(3)确定一个向下的方向,并向下走预先规定的步伐,并更新,即θjJ(θ)
(4)当下降的高度小于某个定义的值,则停止下降;
迭代函数如下:

θj:=θjαθjJ(θ)=θjα1mi=1m(hθ(x(i))y(i))x(i)j
j=(0,1,...,n)
x(i)j 代表第 i 个样本集的第j个特征
θ0:θ0α1mi=1m(hθ(x(i))y(i))x(i)0
θ1:θ1α1mi=1m(hθ(x(i))y(i))x(i)1
...
θn:θnα1mi=1m(hθ(x(i))y(i))x(i)n

2.最小二乘法

最小二乘法推导出来的公式为:

θ=(XTX)1XTY

参考资料:http://blog.csdn.net/xiazdong/article/details/7950084

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值