李宏毅机器学习

最新推荐文章于 2024-10-02 21:43:07 发布

韩向上

最新推荐文章于 2024-10-02 21:43:07 发布

阅读量93

点赞数

分类专栏：李宏毅机器学习文章标签：机器学习 sklearn 深度学习

本文链接：https://blog.csdn.net/luralying/article/details/120310072

版权

李宏毅机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文介绍了回归分析的概念，以宝可梦的CP值为例，展示如何建立线性模型。通过模型评估使用损失函数，并利用梯度下降法寻找最佳参数。讨论了过拟合问题，展示了随着模型复杂度增加，训练误差与测试误差的变化。最后提到了正则化作为解决过拟合的策略。

摘要由CSDN通过智能技术生成

P3–回归

回归的定义
回归的实例（宝可梦的cp值）
梯度下降法
过拟合问题
正则项

回归的定义
Regression 试图确定一个因变量 $y$ (输出)与一些列其他变量 $x$ （自变量）之间关系的强度与特征。
回归的实例（宝可梦的cp值）
step 1: 设计模型–线性模型
step 2: 模型评估–loss function
step 3: 模型优化–梯度下降法

step 1: 设计模型–线性模型
只考虑一个特征 $x_{cp}$ ，可以设计如下的线性模型
$y = wx_{cp} + b$ . 权重 $w$ 和偏置 $b$ 的取值不同，获得的回归模型不同。如下图中
$\left\{\begin{array}{l} f_1: y=10.0+9.0x_{cp}\\ f_2: y=9.8+9.2x_{cp}\\ f_3=-0.8-1.2x_{cp}\\ \end{array}\right.$
在这里插入图片描述
step 2: 模型评估–loss function
用于评估构建模型(参数)的好坏。
$min\sum_{k=1}^n(\hat{y}_k-f_k)=arg min\sum_{k=1}^n(\hat{y}_k-(b+wx_{cp}))$
最小化loss function，可以获得我们想要的参数值

3. 梯度下降法
我们设计了一个函数集 $y=wx_{cp}+b$ ,为了找到最优的回归模型，我们需要找到损失函数 $L(w,b)=\sum_{k=1}^n(\hat{y}_k-(b+wx_{cp}))$ 的最小值。
盲目的去找合适的参数是一件困难的事情，从任意点出发，向极值点靠近最快的方向应该是曲线的切线方向。因此我们可以通过梯度下降法来更新每个参数。
在这里插入图片描述
$w$ 和 $b$ 的更新方式如下图。
其中学习率是一次迭代移动的步长，需要手动的设置.

梯度下降的演化过程

使用梯度下降法优化模型，初始值与最优解的关系.

4. 过拟合问题
假设给定如下图中的数据，分别构造线性回归模型，二次回归模型，三次回归模型，四次回归模型，五次回归模型。这五次回归过程中在训练阶段和测试阶段的误差分别为