【深度学习】S3 线性神经网络 P1 线性回归（未完）

脚踏实地的大梦想家

已于 2024-02-18 09:40:14 修改

阅读量640

点赞数 14

分类专栏： History 札记文章标签：深度学习神经网络线性回归

于 2024-02-17 23:55:07 首次发布

本文链接：https://blog.csdn.net/weixin_43098506/article/details/136135203

版权

History 札记专栏收录该内容

166 篇文章 1 订阅

订阅专栏

本文阐述了线性回归模型的核心要素，包括自变量、因变量的线性关系，以及如何通过平方误差损失函数和梯度下降算法进行模型训练和优化。

摘要由CSDN通过智能技术生成

线性回归基本元素

基本名词

线性回归中，自变量 $\mathbf{x}$ 与因变量 $y$ 之间的关系是线性的， $y$ 可以表示为 $\mathbf{x}$ 中元素的加权和。

开发一个线性回归模型，我们需要包含训练集与测试集的数据集。在数据集中，每行数据称为样本或数据样本，结果 $y$ 值称为标签或目标，自变量因素则称为特征。

自变量输入描述为： $\mathbf{x}^{(i)}=[x_1^{(i)}, x_2^{(i)},...]^T$ ，标签表示为 $y^{(i)}$ ；其中每个 $x$ 为一个自变量特征。

线性模型

假设想要构建一个简单的线性模型，通过房间的面积和房龄预测一个房屋的价格：
$w_{area} \cdot area + w_{age} \cdot age + b$

类似于我们之前学习的二元一次方程， $w_{area}$ 与 $w_{age}$ 称为权重，权重决定了每个特征对我们预测值的影响。 $b$ 称为偏置、偏移量或者截距。偏置是指所有特征都为 0 时，预测值应该为多少。线性函数模型通过加权来对特征进行线性变换，通过偏置项来进行平移操作。

因此，带有权重和偏置的标准线性模型的数学表达式可以写作：
$\hat y = w_1 \cdot x_1 + ... + w_d \cdot x_d + b$

可以简洁表达为：
$\hat y = \mathbf{w^Tx}+b$

上述表达式中，向量 $\mathbf{x}$ 对应于单个数据样本的特征，矩阵 $\mathbf{X}$ 表示数据集矩阵，其中每一行代表一个样本，每一列表示一种特征。给定训练数据特征 $\mathbf{X}$ 和对应的已知标签 $\mathbf{y}$ ，线性回归的目标是找到一组权重向量 $\mathbf{w}$ 和偏置 $b$ ，使得新样本预测标签误差尽可能小。

为了调优权重，我们需具备以下两方面：

一种模型质量的度量方式：损失函数；
一种能够更新模型以提高模型预测质量的方法：梯度下降。

损失函数

损失函数能够量化目标的实际值与预测值之间的差距，损失函数的数值越小代表损失越小。回归问题中最常用的损失函数是平方误差函数。当样本 $i$ 的预测值为 $\hat y^{(i)}$ ，真实标签为 $y^{(i)}$ 时，平方误差定义为以下公式：
$l^{(i)}(\mathbf{w}, b)=\frac 1 2 (\hat y^{(i)}-y^{(i)})^2$

平方误差函数中的平方项在估计值 $\hat y ^{(i)}$ 与实际值 $y^{(i)}$ 之间的差异较大时，会导致更大的损失。为了评估模型在整个数据集上的性能，我们通常计算所有样本的平均损失值。
$L(\mathbf{w}, b)=\frac 1 n \sum ^n _{i=1} l^{(i)}(\mathbf{w},b)$