线性回归的基本元素

最新推荐文章于 2024-09-22 20:09:34 发布

Kevin_D98

最新推荐文章于 2024-09-22 20:09:34 发布

阅读量50

点赞数

分类专栏：动手学深度学习Pytorch版文章标签：线性回归算法回归深度学习

本文链接：https://blog.csdn.net/dingning12469/article/details/134972970

版权

动手学深度学习Pytorch版专栏收录该内容

26 篇文章 0 订阅

订阅专栏

文章目录

前言
1. 线性模型
2.损失函数
3.解析解
4.随机梯度下降
5.用模型进行预测

前言

线性回归基于几个简单的假设：

假设自变量x和因变量y之间的关系是呈线性的，即y可以表示为x中元素的加权和，这里通常允许包含观测值的噪声
假设任何噪声都比较正常，比如遵循正态分布

1. 线性模型

线性假设是指目标（房屋价格）可以表示为特征（面积和房龄）的加权和，如下式：
$price=w_{area}*area+w_{age}*age+b$
严格来说，上式是输入特征的仿射变换。仿射变换的特点是通过加权和对特征进行线性变换，并通过偏置项进行平移。

在机器学习领域，通常使用高维数据集，建模时采用线性代数表示法比较方便，表示为：
$\hat{y}=w_1x_1+......+w_dx_d+b$
用向量点积的形式表示为：
$\hat{y}=w^T\boldsymbol{x}+b$
向量 $\boldsymbol{x}$ 对应于单个数据样本的特征。矩阵 $X\in\mathbb{R}^{n×d}$ 可以表示整个数据集中n个样本，线性模型可以表示为：
$\hat{y}=\boldsymbol{X}w+b$
求和过程将使用广播机制对权重矩阵进行扩展。

2.损失函数

损失函数能够量化目标的实际值与预测值之间的差距。通常选用非负数作为损失，且数值越小表示损失越小。最常用的损失函数是平方误差函数。定义为：
$l^{(i)}(\boldsymbol{w},b)=\frac{1}{2}(\hat{y}^{(i)}-y^{(i)})^2$
需要计算在训练集n个样本上的损失均值：
$L(\boldsymbol{w},b)=\frac{1}{n}\sum_{i=1}^{n}l^{(i)}(\boldsymbol{w},b)=\frac{1}{n}\sum_{i=1}^{n}\frac{1}{2}(\boldsymbol{w}^Tx^{(i)}+b-y^{(i)})^2$
训练模型时，我们希望找到一组参数 $(\boldsymbol{w}^*,b^*)$ 这组参数能最小化所有训练样本上的总损失，如下式：
$\boldsymbol{w}^*,b^*=argminL(\boldsymbol{w},b)$

3.解析解

线性回归是一个很简单的优化问题。线性回归的解可以用一个公式简单的表示，这类解叫做解析解。

4.随机梯度下降

即使在无法得到解析解的情况下，我们仍能有效训练模型。梯度下降方法几乎可以优化所有深度学习模型。他通过不断地在损失函数递减的方向上更新参数来降低误差。

梯度下降需要遍历所有的训练样本，在实际执行中非常慢，因此通常会在需要计算更新的时候随机抽取一小批样本，这个变体就叫做小批量随机梯度下降。

数学公式如下：
$(\boldsymbol{w},b)\leftarrow(\boldsymbol{w},b)-\frac{\eta}{\left | {B} \right |}\sum_{i\in B}\partial_{(\boldsymbol{w},b)}l^{(i)}(\boldsymbol{w},b)$