机器学习之最小二乘线性回归原理解读与公式推导

最新推荐文章于 2024-11-14 11:02:50 发布

MathManiac

最新推荐文章于 2024-11-14 11:02:50 发布

阅读量208

点赞数

文章标签：机器学习线性回归人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52554169/article/details/130888741

版权

(Ordinary) Least Squares Linear Regression

一、条件

样本集呈线性分布

二、原理

用一个超平面/直线去拟合样本集，使样本点的标签值与预测值的差的平方和最小

注：不是样本点到直线的距离最小

$h(x_{i1},x_{i2},\cdots,x_{id}) = \sum\limits_{j=1}^d w_jx_{ij} -\theta$ , $i=1,2,\cdots,n$

令 $x_{i0}=1$ , $w_0=\theta$ , $1,2,\cdots,n$ 即 $\vec x_i = \begin{bmatrix} 1&x_{i1}&x_{i2}&\cdots&x_{id} \end{bmatrix}^T$ , $\vec w = \begin{bmatrix} \theta&w_1&w_2&\cdots&w_d \end{bmatrix}^T$ 则 $h(\vec x_i)=\vec w^T\cdot\vec x_i$

构造损失函数

$\frac{1}{n}\sum\limits_{i=1}^n(h(\vec x_i)-y_i)^2$ ，即均方误差
求损失函数取最小值时对应的假设 $h$

假设 $h$ 与 $\vec w$ 有关，将 $L (h)$ 化为自变量为 $\vec w$ 的函数

得 $L(\vec w) = \frac{1}{n}\sum\limits_{i=1}^n(\vec w^T\cdot \vec x_i-y_i)^2$

令 $\mathbf X=\begin{bmatrix} \vec x_1^T&\vec x_2^T&\cdots&\vec x_n^T \end{bmatrix}^T$ ， $\vec y = \begin{bmatrix} y_1&y_2&\cdots&y_n \end{bmatrix}^T$

得 $L(\vec w) = \frac{1}{n}(\mathbf X\cdot\vec w- \vec y)^T\cdot(\mathbf X\cdot\vec w- \vec y)$

$=\frac{1}{n}(\vec w^T\mathbf X^T\mathbf X\vec w-\vec w^T\mathbf X^T\vec y-\vec y^T\mathbf X\vec w+\vec y^T\vec y)$

$=\frac{1}{n}(\vec w^T\mathbf X^T\mathbf X\vec w-2\vec w^T\mathbf X^T\vec y+\vec y^T\vec y)$ ，因为 $\vec w^T\mathbf X^T\vec y$ 与 $\vec y^T\mathbf X\vec w$ 均为 $1\times1$ 矩阵
1. 梯度下降法
2. 解析法
  
  求 $\vec w^*$ 使 $\frac{\partial}{\partial \vec w}L(\vec w^*) = 0$ ，则 $\vec w^*$ 即为 $L(\vec w)$ 对最优解（凸优化问题）
  
  $\frac{\partial}{\partial \vec w}L(\vec w) = 2\mathbf X^T\mathbf X\vec w-2\vec y^T\mathbf X$
  
  $2\mathbf X^T\mathbf X\vec w^*-2\vec y^T\mathbf X = 0$
  
  $\vec w^*=(\mathbf X^T\mathbf X)^{-1}\vec y^T \mathbf X = (\mathbf X^T\mathbf X)^{-1}\mathbf X^T\vec y$

MathManiac CSDN认证博客专家 CSDN认证企业博客

码龄4年

15: 原创

131万+: 周排名

233万+: 总排名

2万+: 访问

: 等级

262: 积分

182: 粉丝

97: 获赞

16: 评论

194: 收藏

私信

关注

热门文章

分类专栏

leetcode 2篇
笔记 1篇
数学 4篇

最新评论

集合的基本概念
MathManiac: 是我书写错误，谢谢您的指正
集合的基本概念
cs陌路: 难道不应该是b包含a吗，集合a的每个元素都是集合b的元素，能不能严谨点？
集合的基本概念
cs陌路: 实际上，您提到的描述有一点需要纠正。在集合论中，如果集合A的每个元素都是集合B的元素，我们称A为B的子集，用符号表示为 ( A \subseteq B )。但是，说"A 包含 B"或者"B 包含于 A"是不准确的表达方式。正确的表达应该是：
LeetCode 刷题记之课程表
CSDN-Ada助手: 恭喜您撰写了第14篇博客！标题“LeetCode 刷题记之课程表”让我很感兴趣。您的坚持和持续创作令人敬佩，我相信您的博客一定受到了许多读者的欢迎和赞赏。对于下一步的创作建议，我谨虚心地给出一些建议。首先，您可以考虑分享一些在解决课程表问题时的技巧和策略。此外，您还可以探讨一些可能的优化方法，让读者在实践中能够更高效地解决类似的问题。最后，如果可能的话，您可以尝试将LeetCode刷题与实际应用场景相结合，这样读者可以更好地理解算法与实际问题的联系。再次祝贺您，期待您未来更多精彩的创作！
LeetCode 刷题记之段式回文
CSDN-Ada助手: 恭喜您写完了第15篇博客！看到您一直坚持不懈地创作，我真的非常佩服您的毅力。标题中的“段式回文”这个话题听起来非常有趣，我非常期待能够阅读到您的见解和解决方案。在下一步的创作中，我建议您可以尝试深入分析段式回文的原理和应用场景，或者分享一些解题技巧和心得体会，这样能够更好地帮助读者们理解和应用这个概念。当然，这只是我的建议，我相信您一定会有更好的创作安排。期待您的下一篇博客！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。