李宏毅机器学习笔记-回归

最新推荐文章于 2022-09-08 12:19:49 发布

零露_

最新推荐文章于 2022-09-08 12:19:49 发布

阅读量176

点赞数

分类专栏： datawhale李宏毅机器学习笔记文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45184855/article/details/118725046

版权

datawhale李宏毅机器学习笔记专栏收录该内容

6 篇文章 1 订阅

订阅专栏

李宏毅机器学习笔记-回归

1 一元线性回归与多元线性回归

回归：Regression 就是找到一个函数 $f u n c t i o n$ ，通过输入特征 $x$ ，输出一个数值 $S c a l a r$ 。

一元线性回归：以一个特征 $x_{cp}$ 为例，线性模型假设 $y = b + w·x_{cp}$ ；当 $x_{cp}$ 有多个特征时，线性模型： $\sum w·x_{cp}$ 为多元线性模型。

因此，假设线性模型为： $\sum w_ix_i$

其中： $x_i$ ：就是各种特征(fetrure) $x_{cp},x_{hp},x_w,x_h,···$

$w_i$ ：各个特征的权重 $w_{cp},w_{hp},w_w,w_h,··$

$b$ ：偏移量

2 损失函数与梯度下降

怎么衡量模型的好坏呢？从数学的角度来讲，我们使用距离。求真实值与预测值差，来判定模型的好坏。也就是使用损失函数（Loss function）来衡量模型的好坏，统计10组原始数据 $\left ( \hat{y}^n - f(x_{cp}^n) \right )^2$ 的和，和越小模型越好。如下图所示：

在这里插入图片描述

公式定义为： $\sum_{n=1}^{10}\left ( \hat{y}^n - (b + w·x_{cp}) \right )^2$

我们将 $w$ , $b$ 在二维坐标图中展示，如图所示：

在这里插入图片描述

图中每一个点代表着一个模型对应的 $w$ 和 $b$
颜色越深代表模型更优

可以与后面的图11（等高线）进行对比

在这里插入图片描述

3 模型评价与正则化

3.1 梯度下降法

对于已知的模型集合，需要选择最优的模型，即最优参数w，b；

$w^* = arg\ \underset{x}{\operatorname{\min}} L(w)$

对此我们有梯度下降法

在这里插入图片描述

在这里插入图片描述

首先在这里引入一个概念学习率：移动的步长，如图7中 $\eta$

步骤1：随机选取一个 $w^0$
步骤2：计算微分，也就是当前的斜率，根据斜率来判定移动的方向
- 大于0向右移动（增加 $w$ ）
- 小于0向左移动（减少 $w$ ）
步骤3：根据学习率移动
重复步骤2和步骤3，直到找到最低点

从图3-8中可以看出，我们通过梯度下降gradient descent不断更新损失函数的结果，这个结果会越来越小，但是会存在以下问题：

问题1：当前最优（Stuck at local minima）
问题2：等于0（Stuck at saddle point）
问题3：趋近于0（Very slow at the plateau）

可见，梯度下降法并不能保证找到全局最优点，为了解决这一问题，可以通过多次实验，保证每次的起始点不同，最后找到L(w，b)最小值对应的w，b。

3.2 过拟合与正则化

在模型上，我们再可以进一部优化，使用更高次方的模型，如图所示

训练集平均误差【15.4】【15.3】【14.9】【12.8】
测试集平均误差【18.4】【18.1】【28.8】【232.1】

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

可以发现，当模型的阶数越高，模型在训练集的误差很小，但是在测试集上的误差很大，这样的模型，其泛化能力很小，过分的依赖于训练数据，这种情况被称为过拟合。

为了避免过拟合，需要在模型中加入正则项，即当模型变得复杂时，对其进行惩罚。

在这里插入图片描述

在这里插入图片描述

w 越小，表示 $f u n c t i o n$ 较平滑的， $f u n c t i o n$ 输出值与输入值相差不大

在很多应用场景中，并不是 $w$ 越小模型越平滑越好，但是经验值告诉我们 $w$ 越小大部分情况下都是好的。

$b$ 的值接近于0 ，对曲线平滑是没有影响

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习笔记-回归

李宏毅机器学习笔记-回归1 一元线性回归与多元线性回归回归：Regression 就是找到一个函数 functionfunctionfunction ，通过输入特征 xxx，输出一个数值 ScalarScalarScalar。一元线性回归：以一个特征 xcpx_{cp}xcp 为例，线性模型假设 y=b+w⋅xcpy = b + w·x_{cp}y=b+w⋅xcp ；当xcpx_{cp}xcp有多个特征时，线性模型：y=b+∑w⋅xcpy = b + \sum w·x_{cp}y=b+∑w⋅xc
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。