深度学习（二）：回归的定义及其建模过程

最新推荐文章于 2024-05-10 23:48:10 发布

XF永不007

最新推荐文章于 2024-05-10 23:48:10 发布

阅读量703

点赞数

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37590674/article/details/118738739

版权

深度学习笔记（二）：回归的定义及其建模过程

回归的定义及其建模过程

Regression 就是找到一个函数 $f u n c t i o n$ ，通过输入特征 $x$ ，输出一个数值 $S c a l a r$ 。

模型步骤

step1：模型假设，选择模型框架（线性模型）
step2：模型评估，如何判断众多模型的好坏（损失函数）
step3：模型优化，如何筛选最优的模型（梯度下降）

Step 1：模型假设 - 线性模型

一元线性模型（单个特征）

以一个特征 $x_{cp}$ 为例，线性模型假设 $y = b + w·x_{cp}$ ，所以 $w$ 和 $b$ 可以猜测很多模型：
$f_1: y = 10.0 + 9.0·x_{cp} \\ f_2: y = 9.8 + 9.2·x_{cp} \\ f_3: y = - 0.8 - 1.2·x_{cp} \\ ···$

多元线性模型（多个特征）

在实际应用中，输入特征肯定不止 $x_{cp}$ 这一个。所以我们假设 线性模型 Linear model： $\sum w_ix_i$

$x_i$ ：就是各种特征(fetrure) $x_{cp},x_{hp},x_w,x_h,···$
$w_i$ ：各个特征的权重 $w_{cp},w_{hp},w_w,w_h,··$
$b$ ：偏移量

Step 2：模型评估 - 损失函数

如何判断众多模型的好坏

有了这些真实的数据，那我们怎么衡量模型的好坏呢？从数学的角度来讲，我们使用距离。也就是使用损失函数（Loss function）来衡量模型的好坏，统计原始数据 $\left ( \hat{y}^n - f(x_{cp}^n) \right )^2$ 的和，和越小模型越好。如下图所示：

在这里插入图片描述

公式推导的过程：

$\begin{aligned} L(f) & = \sum_{n=1}^{N}\left ( \hat{y}^n - f(x^n) \right )^2，将【f(x) = y】, 【y= b + w·x】代入 \\ & = \sum_{n=1}^{N}\left ( \hat{y}^n - (b + w·x) \right )^2\\ \end{aligned}$

最终定义损失函数 Loss function： $\sum_{n=1}^{N}\left ( \hat{y}^n - (b + w·x) \right )^2$

Step 3：最佳模型 - 梯度下降

【单个特征】: $x_{i}$

如何筛选最优的模型（参数w，b）

已知损失函数是 $\sum_{n=1}^{N}\left ( \hat{y}^n - (b + w·x_{i}) \right )^2$ ，需要找到一个令结果最小的 $f^*$ ，在实际的场景中，我们遇到的参数肯定不止 $w$ , $b$ 。
在这里插入图片描述
定义 $w^* = arg\ \underset{x}{\operatorname{\min}} L(w)$

在这里插入图片描述
首先在这里引入一个概念学习率：移动的步长，如图中 $\eta$

步骤1：随机选取一个 $w^0$
步骤2：计算微分，也就是当前的斜率，根据斜率来判定移动的方向
- 大于0向右移动（增加 $w$ ）
- 小于0向左移动（减少 $w$ ）
步骤3：根据学习率移动
重复步骤2和步骤3，直到找到最低点

在这里插入图片描述
解释完单个模型参数 $w$ ，引入2个模型参数 $w$ 和 $b$ ，其实过程是类似的，需要做的是偏微分，过程如下图所示，

梯度下降推演最优模型的过程

如果把 $w$ 和 $b$ 在图形中展示：

在这里插入图片描述

每一条线围成的圈就是等高线，代表损失函数的值，颜色约深的区域代表的损失函数越小
红色的箭头代表等高线的法线方向

如何验证训练好的模型的好坏

更强大复杂的模型：1元N次线性模型
过拟合问题出现

步骤优化

Step1优化：2个input的线性模型是合并到一个线性模型中

Step2优化：如果希望模型更强大表现更好（更多参数，更多input）

Step3优化：加入正则化

在这里插入图片描述

$w$ 越小，表示 $f u n c t i o n$ 较平滑的， $f u n c t i o n$ 输出值与输入值相差不大
在很多应用场景中，并不是 $w$ 越小模型越平滑越好，但是经验值告诉我们 $w$ 越小大部分情况下都是好的。
$b$ 的值接近于0 ，对曲线平滑是没有影响。

参考资料

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习（二）：回归的定义及其建模过程

深度学习笔记（二）回归的定义及其建模过程    Regression 就是找到一个函数 functionfunctionfunction ，通过输入特征 xxx，输出一个数值 ScalarScalarScalar。模型步骤step1：模型假设，选择模型框架（线性模型）step2：模型评估，如何判断众多模型的好坏（损失函数）step3：模型优化，如何筛选最优的模型（梯度下降）Step 1：模型假设 - 线性模型一元线性模型（单个特征）以一个特征 x
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。