【DW-李宏毅深度学习】Task02回归

最新推荐文章于 2024-07-18 14:22:38 发布

LucyFang2020

最新推荐文章于 2024-07-18 14:22:38 发布

阅读量102

点赞数

分类专栏：笔记文章标签：深度学习

本文链接：https://blog.csdn.net/LucyLuo2020/article/details/118712459

版权

笔记专栏收录该内容

12 篇文章 0 订阅

订阅专栏

参考链接：https://github.com/datawhalechina/leeml-notes

文章目录

一、回归定义和应用例子
- 1.1回归定义
- 1.2应用举例
二、模型步骤
三、如何验证训练好的模型的好坏
- 3.1 平均误差
四、步骤优化
五、总结

一、回归定义和应用例子

1.1回归定义

回归（Regression）就是找到一个函数（ $f u n c t i o n$ ），通过输入特征 $x$ ，输出一个数值标量（ $S c a l a r$ ）。

1.2应用举例

1.股市预测（Stock market forecast）
- 输入：过去10年股票的变动、新闻咨询、公司并购咨询等
- 输出：预测股市明天的平均值
2.自动驾驶（Self-driving Car）
- 输入：无人车上的各个sensor的数据，例如路况、测出的车距等
- 输出：方向盘的角度
3.商品推荐（Recommendation）
- 输入：商品A的特性，商品B的特性
- 输出：购买商品B的可能性
4.Pokemon精灵攻击力预测（Combat Power of a pokemon）：
- 输入：进化前的CP值、物种（Bulbasaur）、血量（HP）、重量（Weight）、高度（Height）
- 输出：进化后的CP值

二、模型步骤

step1：模型假设，选择模型框架（线性模型）。
step2：模型评估，如何判断众多模型的好坏（损失函数）。
step3：模型优化，如何筛选最优的模型（梯度下降）。

2.1模型假设（线性模型）

2.1.1一元线性模型（单个特征）

以一个特征 $x_{cp}$ 为例，线性模型假设 $y = b + w·x_{cp}$ ，所以 $w$ 和 $b$ 可以猜测很多模型，如：
$f_1: y = 10.0 + 9.0·x_{cp} \\ f_2: y = 9.8 + 9.2·x_{cp} \\ f_3: y = - 0.8 - 1.2·x_{cp} \\ ···$

虽然可以做出很多假设，但在这个例子中，显然 $f_3: y = - 0.8 - 1.2·x_{cp}$ 的假设是不合理的，因为进化后CP值不可能是个负值。

2.1.2多元线性模型（多个特征）

通常情况下，输入特征不止 $x_{cp}$ 这一个。例如，进化前的CP值、物种（Bulbasaur）、血量（HP）、重量（Weight）、高度（Height）等特征就有多个。

2-1

所以假设 线性模型（Linear model）： $\sum w_ix_i$ ，其中：

$x_i$ ：各种特征(fetrure) $x_{cp},x_{hp},x_w,x_h,···$
$w_i$ ：各个特征的权重 $w_{cp},w_{hp},w_w,w_h,··$
$b$ ：偏移量

2.2模型评估（损失函数）

对【单个特征】: $x_{cp}$ 进行分析。

2.2.1收集和查看训练数据

定义： $x^1$ 是进化前的CP值， $\hat{y}^1$ 进化后的CP值， $\hat{}$ 所代表的是真实值。

在这里插入图片描述

将10组原始数据在二维图中展示，图中的每一个点 $(x_{cp}^n,\hat{y}^n)$ 对应进化前的CP值和进化后的CP值。

在这里插入图片描述

2.2.2如何判断众多模型的好坏

从数学的角度来考虑，可以使用距离。求【进化后的CP值】与【模型预测的CP值】差，来判定模型的好坏。即使用损失函数（Loss function）来衡量模型的好坏，统计10组原始数据 $\left ( \hat{y}^n - f(x_{cp}^n) \right )^2$ 的和，和越小模型越好。如下图所示：

在这里插入图片描述
公式推导如下：
$\begin{aligned} L(f) & = \sum_{n=1}^{10}\left ( \hat{y}^n - f(x_{cp}^n) \right )^2，将【f(x) = y】, 【y= b + w·x_{cp}】代入 \\ & = \sum_{n=1}^{10}\left ( \hat{y}^n - (b + w·x_{cp}) \right )^2\\ \end{aligned}$
最终定义损失函数 Loss function： $\sum_{n=1}^{10}\left ( \hat{y}^n - (b + w·x_{cp}) \right )^2$
将 $w$ , $b$ 在二维坐标图中展示，如下图所示：
在这里插入图片描述