线性回归个人总结

最新推荐文章于 2022-08-10 22:52:18 发布

架良

最新推荐文章于 2022-08-10 22:52:18 发布

阅读量2.2k

点赞数

分类专栏：机器学习 python

本文链接：https://blog.csdn.net/wh_0701/article/details/100545655

版权

线性回归是通过最小化误差平方和找到最佳拟合线的统计方法。本文介绍了线性回归的定义、算法原理、计算过程，并探讨了局部加权线性回归（LWLR）以改善欠拟合问题。同时，讨论了缩减系数的技术，包括岭回归和LASSO，以及向前逐步回归，帮助简化数据并理解模型中重要特征。

摘要由CSDN通过智能技术生成

定义

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。
回归的主要目的是为了预测数值类型的目标值，最简单的办法就是构建一个关于自变量和因变量的关系式，比如某套房屋的价格计算公式如下：
$房价 (万元) = 1.5 * 建筑面积 + 0.85 * 公摊面积$
这就是所谓的回归方程，其中的1.5，0.85成为回归系数，求这些回归系数的过程就是回归。一旦得到了回归方程，我们可以方便的预测出来一套新房子的价格是多少。转换成数学语言，假设回归系数是一个列向量，我们的输入值是一个行向量，我们直接用这两个向量相乘就是最终的结果。

算法原理

如何从一堆数据中求出回归系数？
我们假设输入数据存储在矩阵 $\bm{X}$ 中，它是一个m*n的矩阵，回归系数存放在向量 $\bm{w}$ 中，它是一个n维列向量。那么对于一个新的输入 $\bm{x}_{1}$ ，预测结果通过 $\bm{Y}_{1}=\bm{x}_{1}^{T}\bm{w}$ 得到。现在的重点就是如何求出 $\bm{w}$ ，一个常用的方法就是找到使误差最小的 $\bm{w}$ 。这里的误差是指实际值和预测值直接的差值，因为差值有正有负，所有我们采用误差的平方来计算。
平方误差的公式如下：
$\sum_{i=1}^{m}(\bm{y}_{1}-\bm{x}_{1}^{T}\bm{w})$
转换成矩阵形式可以表达为 $(y-\bm{Xw})^{T}(y-\bm{Xw})$ ，
对 $\bm{w}$ 求导，得到 $2\bm{X}^{T}(\bm{Xw}-y)$ ，令导数值为0，得到 $\bm{w}$