《动手学深度学习》学习笔记

最新推荐文章于 2024-08-17 14:10:11 发布

三金无盖

最新推荐文章于 2024-08-17 14:10:11 发布

阅读量1.7k

点赞数 60

文章标签：深度学习学习笔记

本文链接：https://blog.csdn.net/m0_57248668/article/details/139065587

版权

本文是《动手学深度学习》第三章线性神经网络的学习笔记，主要探讨线性回归的基本元素，包括线性模型、损失函数、解析解和随机梯度下降。线性回归是深度学习的基础，通过理解线性模型和优化方法，为后续的深度网络学习打下基础。

摘要由CSDN通过智能技术生成

第三章线性神经网络

3.1 线性回归

回归（regression）是能为一个或多个自变量与因变量之间关系建模的一类方法。在自然科学和社会科学领域，回归经常用来表示输入和输出直接的关系。

在机器学习中的大多数任务通常与预测有关。当我们想要预测一个数值时，就会涉及到回归问题。常见的例子包括：预测价格（房屋、股票等）、预测住院时间（针对住院病人等）、预测需求（零销售量等）。但并不是所有的预测都是回归问题。在后面的章节中，我们将介绍分类问题。分类问题的目标是预测数据属于一组类别中的哪一类。

3.1.1 线性回归的基本元素

线性回归可以追溯到19世纪初，它在回归的各种标准工具中最简单而且最流行。线性回归基于几个简单的假设：首先，假设自变量x和因变量y之间的关系是线性的，即y可以表示为x中元素的加权和，这里通常允许包含观测值的一些噪声；其次，我们假设任何噪声都比较正常，如噪声遵循正态分布。

为了解释线性回归，举一个实际例子：我们希望根据房屋的面积（平方英尺）和房龄（年）来估算房屋价格（美元）。为了开发一个能预测房价的模型，我们需要收集一个真实的数据集。这个数据集包括房屋的销售价格、面积和房龄。在机器学习的术语中，该数据集也称为训练数据集（training data set）。每行数据（如一次房屋交易相对应的数据）成为样本（sample），也可以成为数据点（data point）。我们把试图预测的目标（如预测房屋价格）称为标签（label）或目标（target）。预测所依据的自变量（面积和房龄）称为特征（feature）或协变量（covariate）。

通常，我们使用n表示数据集中的样本数。对索引为i的样本，其输入表示为 $X^{(i)}=[x_{1}^{(i)},x_{2}^{(i)}]^{T}$ ,其对应的标签是 $y^{(i)}$ .

3.1.1.1 线性模型

线性假设是指目标（房屋价格）可以表示为特征（面积和房龄）的加权和，如下面的式子：

$price=w_{area}\cdot area+w_{age}\cdot age+b$

式中的 $w_{area}\: w_{age}$ 称权重（weight），权重决定了每个特征对我们预测值的影响。b称为偏置（bias）、偏移量（offset）或截距（intercept）。偏置是指当所有特征都取值为0时，预测值应该为多少。即使现实中不会有任何房子的面积是0或芳龄刚好为0年，我们仍需要偏置项。如果没有偏置项，我们模型的表达能力将受到限制。严格来讲，上述式子是输入特征的一个仿射变换（affine transformation）。仿射变换的特点是通过加权和对特征进行线性变换（linear transformation），并通过偏置项来进行平移（translation）。

给定一个数据集，我们的目标是寻找模型的权重w和偏置b，使得根据模型做出的预测大体符合数据里的真实价格。输出的预测值由输入特征通过线性模型的仿射变换决定，仿射变换由所选权重和偏置确定。

而在机器学习领域，我们通常使用的是高维数据集，建模时采用线性代数表示会较为方便。当我们的输入包含d个特征时，我们将预测结果 $\hat{y}$ 表示为： $\hat{y}=w_{1}x_{1}+...+w_{d}x_{d}+b$

最低0.47元/天解锁文章

三金无盖

关注

60
点赞
踩
17

收藏

觉得还不错? 一键收藏
打赏
0
评论
《动手学深度学习》学习笔记

回归（regression）是能为一个或多个自变量与因变量之间关系建模的一类方法。在自然科学和社会科学领域，回归经常用来表示输入和输出直接的关系。在机器学习中的大多数任务通常与预测有关。当我们想要预测一个数值时，就会涉及到回归问题。常见的例子包括：预测价格（房屋、股票等）、预测住院时间（针对住院病人等）、预测需求（零销售量等）。但并不是所有的预测都是回归问题。在后面的章节中，我们将介绍分类问题。分类问题的目标是预测数据属于一组类别中的哪一类。
复制链接

扫一扫