【线性回归】机器学习专项课程学习记录1——线性回归解决回归问题

最新推荐文章于 2022-09-28 08:00:01 发布

小飞狗狗

最新推荐文章于 2022-09-28 08:00:01 发布

阅读量101

点赞数

分类专栏： 2022吴恩达机器学习文章标签：机器学习回归线性回归

本文链接：https://blog.csdn.net/m0_46314771/article/details/125577047

版权

2022吴恩达机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

说明

本系列笔记是笔者在学习2022年6月吴恩达机器学习专项课程时创作的，用以巩固知识点和日后复习。

学习目标

掌握线性回归的原理和实现。

笔记

1 线性回归

线性回归的表达式为： $f_{\mathbf{w},b}(\mathbf{x}) = w_0x_0 + w_1x_1 +... + w_{n-1}x_{n-1} + b$
矩阵形式是： $f_{\mathbf{w},b}(\mathbf{x}) = \mathbf{w} \cdot \mathbf{x} + b$
其中，
$\mathbf{X} = \begin{pmatrix} x^{(0)}_0 & x^{(0)}_1 & \cdots & x^{(0)}_{n-1} \\ x^{(1)}_0 & x^{(1)}_1 & \cdots & x^{(1)}_{n-1} \\ \cdots \\ x^{(m-1)}_0 & x^{(m-1)}_1 & \cdots & x^{(m-1)}_{n-1} \end{pmatrix}$
$\mathbf{w} = \begin{pmatrix} w_0 \\ w_1 \\ \cdots\\ w_{n-1} \end{pmatrix}$

2 线性回归的损失函数

线性回归的损失函数是均方误差损失： $J(\mathbf{w},b) = \frac{1}{2m} \sum\limits_{i = 0}^{m-1} (f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)})^2$

3 线性回归的梯度下降

$w_j = w_j - \alpha \frac{\partial J(\mathbf{w},b)}{\partial w_j} \tag{1}$
$\alpha \frac{\partial J(\mathbf{w},b)}{\partial b} \tag{2}$

其中，
$\frac{\partial J(\mathbf{w},b)}{\partial w_j} = \frac{1}{m} \sum\limits_{i = 0}^{m-1} (f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)})x_{j}^{(i)} \tag{3}$
$\frac{\partial J(\mathbf{w},b)}{\partial b} = \frac{1}{m} \sum\limits_{i = 0}^{m-1} (f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)})\tag{4}$

4 多项式回归（Polynomial Regression）

利用特征工程，线性回归可以拟合复杂的非线性方程。

4.1 特征工程（Feature Engineering）

什么是特征工程？
根据学科知识，将现有的特征变量x进行某种变换形成新的特征的过程就是特征工程。

怎么选择特征变量？
识别重要的特征看其权重，如果权重的绝对值越大，该特征的重要性越大。

注意：
特征工程后要对新构建的特征进行缩放以加快梯度下降。

4.2 多项式回归

泰勒展开式

5 正则化的线性回归

在线性回归模型中使用正则化技术可以减小过拟合，通过向损失函数添加正则化项来实现。（损失函数变了，梯度下降中求偏导数的公式也要发生相应的变化）

5.1 计算损失

向线性回归的损失函数 $J(\mathbf{w},b)$ 中添加L2正则化项 $\frac{\lambda}{2m} \sum_{j=0}^{n-1} w_j^2$ ：
$J(\mathbf{w},b) = \frac{1}{2m} \sum\limits_{i = 0}^{m-1} (f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)})^2 + \frac{\lambda}{2m} \sum_{j=0}^{n-1} w_j^2$

5.2 梯度下降

正则化也影响了线性回归的梯度下降中L对w的偏导数的计算：
$w_j = w_j - \alpha \frac{\partial J(\mathbf{w},b)}{\partial w_j}$

$\frac{\partial J(\mathbf{w},b)}{\partial w_j} = \frac{1}{m} \sum\limits_{i = 0}^{m-1} (f_{\mathbf{w},b}(\mathbf{x}^{(i)}) - y^{(i)})x_{j}^{(i)} + \frac{\lambda}{m} w_j$