动手学深度学习

最新推荐文章于 2022-09-06 08:41:36 发布

Camellia@

最新推荐文章于 2022-09-06 08:41:36 发布

阅读量491

点赞数

分类专栏：深度学习 pytorch

本文链接：https://blog.csdn.net/qq_51143009/article/details/115574755

版权

深度学习同时被 2 个专栏收录

33 篇文章 2 订阅

订阅专栏

pytorch

6 篇文章 0 订阅

订阅专栏

1.在某种形式上，机器学习就是做出预测。

2.经典统计学习技术中的线性回归和softmax回归可以视为线性神经网络。

3.权重决定了每个特征对我们预测值的影响。偏置是指当所有特征都取值为0时，预测值应该为多少。如果没有偏置项，我们模型的表达能力将受到限制。
4. 在这里插入图片描述
是输入特征的一个仿射变换（affine transformation）。仿射变换的特点是通过加权和对特征进行线性变换（linear transformation），并通过偏置项来进行平移（translation）。
开始寻找最好的模型参数（model parameters） w 和 b 之前，我们还需要两个东西：（1）一种模型质量的度量方式（5.损失函数）；（2）一种能够更新模型以提高模型预测质量的方法（6梯度下降）。

5.损失函数可以确定一个拟合程度的度量，能够量化目标的实际值与预测值之间的差距。通常我们会选择非负数作为损失，且数值越小表示损失越小，完美预测时的损失为0。回归问题中最常用的损失函数是平方误差函数。

用公式简单表示的线性回归的解叫做解析解，

首先，我们将偏置 b 合并到参数 w 中。合并方法是在包含所有参数的矩阵中附加一列。我们的预测问题是最小化 ∥y−Xw∥2 。这在损失平面上只有一个临界点，这个临界点对应于整个区域的损失最小值。将损失关于 w 的导数设为0，得到解析解（闭合形式）：
w∗=(X⊤X)−1X⊤y.

像线性回归这样的简单问题存在解析解，但并不是所有的问题都存在解析解。解析解可以进行很好的数学分析，但解析解的限制很严格，导致它无法应用在深度学习里。

6.梯度下降（gradient descent）的方法，这种方法几乎可以优化所有深度学习模型。它通过不断地在降低损失的方向上更新参数来降低误差。
在这里插入图片描述
7.在训练了预先确定的若干迭代次数后（或者直到满足某些其他停止条件后），我们记录估计的模型参数，表示为 w^,b 。但是，即使我们的函数真是线性的且无噪声。我们估计得到的参数也不会是损失的精确最小值。因为算法会使得损失向最小值缓慢收敛，但不能在有限的步数内非常精确地达到最小值。

8. 在这里插入图片描述
利用均方误差损失函数（简称均方损失）可以用于线性回归的一个原因是：假设观测中包含噪声，其中噪声服从正态分布。

Camellia@

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
动手学深度学习

1.在某种形式上，机器学习就是做出预测。2.经典统计学习技术中的线性回归和softmax回归可以视为线性神经网络。3.权重决定了每个特征对我们预测值的影响。偏置是指当所有特征都取值为0时，预测值应该为多少。如果没有偏置项，我们模型的表达能力将受到限制。4.是输入特征的一个仿射变换（affine transformation）。仿射变换的特点是通过加权和对特征进行线性变换（linear transformation），并通过偏置项来进行平移（translation）。开始寻找最好的模型参数（m
复制链接

扫一扫