最小二乘法的原理及实现

两个版本理解最小二乘

目录

1 从纸面上粗浅理解

2 从几何意义上深入理解


1 从纸面上粗浅理解

最近需要用到最小二乘法,尽管一直知道通过matlab直接就能实现,但是具体做法以及推导过程不清楚,心虚,以此博文记录一下。

回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。对于二维空间线性是一条直线;对于三维空间线性是一个平面,对于多维空间线性是一个超平面。 [4] 

最常用的是普通最小二乘法( Ordinary Least SquareOLS):所选择的回归模型应该使所有观察值的残差平方和达到最小。(Q为残差平方和)- 即采用平方损失函数。

步骤:

1、样本回归模型:

2、平方损失函数

 

3、 Q对两个待估参数的偏导数

 

4、解方程

求得使平方损失函数取得极值点的那两个系数。这是一次线性回归问题。

 

使用向量表示OLSOrdinary Least Square, 普通最小二乘法),则有:

XTXβ=XTy

也即:
β=(XTX)-1XTy

其中是最小二乘估计的线性回归系数。

也就是说,通过原始的散点(Xi,Yi),计算得到的是系数向量 ,再进行计算时,使用向量 与X相乘,即可得到Y。

最小二乘法在OMP稀疏恢复算法中有用到。

2 从几何意义上深入理解

很多拟合问题最终都可以归结为Ax=b的形式,比如,我们用传感器得到一组数据,例如,时刻t1=1,温度f是5,时刻t2=2,温度是8,时刻t3=3,温度是15,时刻t4=4,温度是16,那么(t,f)可以总结为(1,5),(2,8),(3,15),(4,16)。假如我们经验认为,温度和时刻是一次函数,也就是:

f=x1+x2*t

代入数据后,写成Ax=b的形式:

\begin{bmatrix} 1 & 1\\ 1&2 \\ 1 &3 \\ 1 & 4 \end{bmatrix}\begin{bmatrix} x1\\ x2 \end{bmatrix}=\begin{bmatrix} 5\\ 8\\ 15\\ 16 \end{bmatrix}\Rightarrow \begin{bmatrix} \mathbf{v1} & \mathbf{v2} \end{bmatrix}\begin{bmatrix} x1\\ x2 \end{bmatrix}=\mathbf{b}        (1)

这里v1 v2 b是列向量,x1,x2是标量,就是一个实数。

这里的限制方程有4个,自变量只有两个,如果任意两个等式之间不存在倍数关系,或者不是线性关系,那么这个方程的解析解是不存在的,也就是精确的解是没有的,因为是超定方程。或者这样理解,把A看做是基向量,b是通过v1=[1 1 1 1]T和v2=[1 2 3 4]T这两个列向量线性叠加而来,系数分别是x1 x2。可以想象,由这两个列向量的任意组合的集合,将会张成一个类似于平面的超平面S。

当然,如果这两个列向量是[1 0]T和[0 1]T的话,那么他们的任意组合就是我们平常可以看到的二维平面。维度变为4时,想象不出来其样貌,但是依然遵守基本的性质,比如垂直的向量,他们的点积是0,也就是对应元素相乘的和是0。

假如无论x1 x2怎么组合,都无法用v1和v2表示,那就证明向量b不在v1 v2张成的空间中,这时候我们想到什么办法呢?退而求其次,我们找到b在S上的投影\tilde{b},用它来近似b,这不就是最妥协的办法了吗?

这样,根据向量的减法,b-\tilde{b}就是与\tilde{b}垂直的法线了。法线是和平面S处处垂直的,也就是和任意向量Ax的内积都是0,那根据垂直的性质:

 

(\mathbf{b}-\tilde{\mathbf{\mathbf{b}}},\mathbf{A}\mathbf{x}) =0 \Rightarrow ({\mathbf{A}\mathbf{x}})^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0       (2)

( , )表示内积,点积,用正常的按对应元素乘后相加就表示为右侧的形式。

({\mathbf{A}\mathbf{x}})^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0\Rightarrow \mathbf{x}^{T}\mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0   (3)

{\mathbf{A}}^{T}(\mathbf{b}-\tilde{\mathbf{b}})看做是列向量,与x同型。一个向量和同型的任意向量x的内积都是0,那么只能说明,这个向量是0。

\mathbf{x}^{T}\mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0\Rightarrow \mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0        (4)

\tilde{b}怎么表示?应该牢记,\tilde{b}是b在平面S上的投影,自然只能用v1 v2来表示:

\begin{bmatrix} \textbf{v1} & \textbf{v2} \end{bmatrix}\begin{bmatrix} \tilde{x1}\\ \tilde{x2} \end{bmatrix}=\textbf{A}\tilde{\textbf{x}}=\mathbf{\tilde{b}}     (5)

(5)代入(4),就变成了

\mathbf{A}^{T}(\mathbf{b}-\tilde{\mathbf{b}})=0\Rightarrow \mathbf{A}^{T}(\mathbf{b}-\mathbf{A}\tilde{\mathbf{x}})=0      (6)

整理后解可以得到最小二乘解:

\mathbf{A}^{T}(\mathbf{b}-\mathbf{A}\tilde{\mathbf{x}})=0\Rightarrow \mathbf{A}^{T}\mathbf{b}=\mathbf{A}^{T}\mathbf{A}\tilde{\mathbf{x}}\Rightarrow \tilde{\mathbf{x}}=(\mathbf{A}^{T}\mathbf{A})^{+}\mathbf{A}^{T}\mathbf{b}

这里的(\mathbf{A}^{T}\mathbf{A})^{+}是伪逆,可以简单理解为是ATb除以(ATA)。

这样,就得到了最小二乘拟合的系数。

 

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业级学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值