最小二乘法（Least Squares Method）

最新推荐文章于 2024-06-14 10:40:06 发布

coco_1998_2

最新推荐文章于 2024-06-14 10:40:06 发布

阅读量2.4k

点赞数

分类专栏：人工智能文章标签：最小二乘

原文链接：https://blog.csdn.net/u012294618/article/details/79594150

版权

人工智能专栏收录该内容

26 篇文章 1 订阅

订阅专栏

1、最小二乘
最小二乘，广义上来说其实是机器学习中的平方损失函数：
L(Y,f(X))=(Y-f(X))^2

对应于模型 f 的线性和非线性之分，最小二乘也相应地分为线性最小二乘和非线性最小二乘。
我们通常所讲的“最小二乘法”，其实是狭义上的“最小二乘”，指的是在线性回归下采用平方损失函数，进行线性拟合参数求解的、矩阵形式的公式方法。
线性最小二乘有闭式解，可用最小二乘法求解，也可采用迭代法（如梯度下降）求解；非线性最小二乘没有闭式解，只能采用迭代法求解。
关于模型 f 的线性和非线性，读者可前往阅读参考文献[2]和[3]，这里我们只强调，有些所谓的非线性模型可以通过适当的变换将其化为标准的线性模型，但并非所有的非线性模型都可以线性化。

2、最小二乘法
前面做完了铺垫，这一节我们进入主题，讲一讲最小二乘法。
考虑超定方程组（超定指未知数小于方程个数）：
$\sum_{j=1}^{n}X_{ij}\beta_j=y_i,i=1,2,3,\dots,m$

其中，m 代表样本数，n 代表参数维度，将上式向量化得到：
$X\beta=y$

$X=\begin{bmatrix} X_{11}&X_{12}&\cdots & X_{1n} \\ X_{21}&X_{22}&\cdots & X_{2n} \\ \vdots & \vdots & &\vdots \\ X_{m1}&X_{m2}&\cdots & X_{mn} \end{bmatrix},\beta=\begin{bmatrix} \beta_1 \\ \beta_2 \\ \vdots \\ \beta_n \end{bmatrix},y=\begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_m \end{bmatrix}$

为了求解 β 的最佳估计值 β^，可采用最小二乘法，问题转化如下：
$S(\beta)=||X\beta-y||$

$\hat \beta = arg min(S(\beta))$

通过对 S(β) 进行微分求最值，可得：
$X^{T}X\beta=X^{T}y$

如果矩阵 $X^{T}X$ 非奇异，则β有唯一解：
$\hat \beta=(X^{T}X)^{-1}X^{T}y$

参考文献
[1] https://www.zhihu.com/question/20822481
[2] https://baike.baidu.com/item/非线性最小二乘法/2697652
[3] https://baike.baidu.com/item/非线性模型
[4] https://baike.baidu.com/item/最小二乘法/2522346?fr=aladdin
[5] https://zh.wikipedia.org/wiki/最小二乘法
以上为本文的全部参考文献，对原作者表示感谢。

coco_1998_2

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
最小二乘法（Least Squares Method）

1、最小二乘最小二乘，广义上来说其实是机器学习中的平方损失函数：对应于模型 f 的线性和非线性之分，最小二乘也相应地分为线性最小二乘和非线性最小二乘。我们通常所讲的“最小二乘法”，其实是狭义上的“最小二乘”，指的是在线性回归下采用平方损失函数，进行线性拟合参数求解的、矩阵形式的公式方法。线性最小二乘有闭式解，可用最小二乘法求...
复制链接

扫一扫

专栏目录