机器学习-最小二乘法

最新推荐文章于 2024-08-17 07:26:39 发布

林苏泽

最新推荐文章于 2024-08-17 07:26:39 发布

阅读量538

点赞数 1

分类专栏：深度学习文章标签：机器学习最小二乘法人工智能

本文链接：https://blog.csdn.net/weixin_45911397/article/details/133897993

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文解释了最小二乘法在数据拟合中的应用，通过线性模型Y=WX+B，介绍了损失函数的计算方式，导数为0的最优解求法，以及为何Y^TXW与WTXTY相等。最终给出了最优权重向量w*的计算公式。

摘要由CSDN通过智能技术生成

概况

最小二乘法其实就是为数据(二维)拟合出一条直线，为(三维)数据拟合出一个面。来最大程度的是我们的样本点落在该直线上。
使得我们找到一条直线使所以的样本点尽可能靠近该直线，即每个样本点到直线的距离最短。

Y=WX+B，W是权重，B是偏移量。
损失函数
$L(w)=\sum_{i=1}^m||w^Tx_i-y_i||^2$
$=\sum_{i=1}^m(w^Tx_i-y_i)^2$
$W^TX^T-Y^t][XW-Y]$
$W^TX^TXW-Y^TXW-W^TX^TY+Y^TY$
$W^TX^TXW-2W^TX^TY+Y^TY$
为什么 $Y^TXW$ 和 $W^TX^TY$ 是相等的，因为 $Y^T$ 的维度是(1,n), $X$ 的维度是(n,n), $W$ 的维度是(n,1)，所以 $Y^TXW$ 的维度是(1，1)也就是一个常数值。而 $W^T$ 的维度为(1，n), $X^T$ 的维度为(n,n)， $Y$ 的维度为(n,1)。 $W^TX^TY$ 的维度为(1，1)所以都是常数，所以转置不转置不影响数值的值。所以是相等的。

因为我们采用的是最小二乘估计，所以这里希望损失函数最小，所以求取函数导数为0的点，就是我们的最优解，因为这里是二次函数，所以导数为0的点就是最值点。
最优解为 $w^*$
$w^*=argmin_wL(w)$
对其求导，并令其导数为0.
$导数=2X^TXW-2X^TY=0$
具体过程是：
$dL(w)=d(W^TX^TXW-2W^TX^TY+Y^TY)$
$d(W^T)X^TXW-2d(W^T)X^TY+W^TX^TXd(W)$
$X^TXWd(W)-2X^TYd(W)+W^TX^TXd(W)$
即 $2X^TXW-2X^TY=0$
$w^*=(X^TX)^{-1}X^TY$
然后我们可以构造决策函数：
$f(x)=(w^*)^Tx$

林苏泽

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习-最小二乘法

因为我们采用的是最小二乘估计，所以这里希望损失函数最小，所以求取函数导数为0的点，就是我们的最优解，因为这里是二次函数，所以导数为0的点就是最值点。最小二乘法其实就是为数据(二维)拟合出一条直线，为(三维)数据拟合出一个面。使得我们找到一条直线使所以的样本点尽可能靠近该直线，即每个样本点到直线的距离最短。的维度为(1，1)所以都是常数，所以转置不转置不影响数值的值。的维度是(1，1)也就是一个常数值。的维度是(n,1)，所以。的维度是(1,n),的维度是(n,n),的维度为(1，n),的维度为(n,n)，
复制链接

扫一扫

专栏目录