线性回归(归纳)

最新推荐文章于 2024-03-13 06:02:48 发布

追风箭0211

最新推荐文章于 2024-03-13 06:02:48 发布

阅读量578

点赞数

分类专栏：机器学习算法总结

本文链接：https://blog.csdn.net/Sirow/article/details/109371386

版权

机器学习算法总结专栏收录该内容

8 篇文章

订阅专栏

线性回归介绍

1.简单介绍线性回归

线性回归就是利用的样本 $D=(X_i,Y_j),i =1,2,3...N,X_i$ 是特征数据，可能是一个，也可能是多个，通过有监督的学习，学习到由 $x$ 到 $y$ 的映射 $h$ ,利用该映射关系对未知的数据进行预估，因为 $y$ 为连续值，所以是回归问题。

2. 线性回归的假设函数是什么形式？

线性回归的假设函数（ $θ_0$ 表示截距项， $x_0=1$ ,方便矩阵表达）：
在这里插入图片描述
其中 $θ, x$ 都是列向量

3. 线性回归的代价(损失)函数是什么形式？

在这里插入图片描述

4. 简述岭回归与Lasso回归以及使用场景。

目的：
- 解决线性回归出现的过拟合的请况。
- 解决在通过正规方程方法求解 $θ$ 的过程中出现的 $X^TX$ 不可逆的请况。
本质：
- 约束(限制)要优化的参数

这两种回归均通过在损失函数中引入正则化项来达到目的：

线性回归的损失函数：

在这里插入图片描述

岭回归
- 损失函数：
Lasso回归
- 损失函数：

本来Lasso回归与岭回归的解空间是全部区域，但通过正则化添加了一些约束，使得解空间变小了，甚至在个别正则化方式下，解变得稀疏了。
在这里插入图片描述
如图所示，这里的 $w_1,w_2$ 都是模型的参数，要优化的目标参数，那个红色边框包含的区域，其实就是解空间，正如上面所说，这个时候，解空间“缩小了”，你只能在这个缩小了的空间中，寻找使得目标函数最小的 $w_1,w_2$ 左边图的解空间是圆的，是由于采用了 $L 2$ 范数正则化项的缘故，右边的是个四边形，是由于采用了 $L 1$ 范数作为正则化项的缘故，大家可以在纸上画画， $L 2$ 构成的区域一定是个圆， $L 1$ 构成的区域一定是个四边形。

再看看那蓝色的圆圈，再次提醒大家，这个坐标轴和特征（数据）没关系，它完全是参数的坐标系，每一个圆圈上，可以取无数个 $w_1,w_2$ ，这些 $w_1,w_2$ 有个共同的特点，用它们计算的目标函数值是相等的！那个蓝色的圆心，就是实际最优参数，但是由于我们对解空间做了限制，所以最优解只能在“缩小的”解空间中产生。