Regression回归_avregression-CSDN博客

本文链接：https://blog.csdn.net/weixin_43097621/article/details/111350175

Regression回归

回归定义和应用例子

回归定义

Regression 就是找到一个函数 function ，通过输入特征 xx，输出一个数值 Scalar。

应用例子

股市预测，自动驾驶，商品推荐，Pokemon

模型步骤

模型假设，选择模型框架（线性模型）
模型评估，如何判断众多模型的好坏（损失函数）
模型优化，如何筛选最优的模型（梯度下降）

模型假设

1.一元线性模型（一个特征）

$y=b+x_{cp}$

2.多元线性模型（多个特征）

$y=b+\sum w_ix_i$

$x_i$ ：各种特征

$w_i$ ：特征的权重

b：偏移量

模型评估

收集和查看训练数据

将原始数据在二维图中表示

判断模型好坏

损失函数：

$L(f)=\sum_{n=1}^{10}(\hat y^n-f(X_{cp}^n))^2\\【f(x)=y】,【y=b+w·x_{cp}】\\Loss~function:L(f)=\sum_{n=1}^{10}(\hat y^n-(b+w·x_{cp}))^2$

模型优化

最佳模型——梯度下降

在这里插入图片描述

首先在这里引入一个概念学习率：移动的步长，如图中的 $ η $

步骤1：随机选取一个 $ w^0 $
步骤2：计算微分，也就是当前的斜率，根据斜率来判定移动的方向
- 大于0向右移动（增加w）
- 小于0向左移动（减少w）
步骤3：根据学习率移动
重复步骤2和步骤3，直到找到最低点

在这里插入图片描述

$\nabla L=\begin{bmatrix} \frac {\partial l}{\partial w} \\ \frac {\partial l}{\partial b} \end{bmatrix}_{gradient}$
在这里插入图片描述

梯度下降算法在现实世界中面临的挑战

问题1：当前最优（Stuck at local minima）
问题2：等于0（Stuck at saddle point）
问题3：趋近于0（Very slow at the plateau）

w和b偏微分的计算方法

$L(f)=\sum_{n=1}^{10}(\hat y^n-(b+w·x_{cp}^n))^2$

$\frac {\partial l}{\partial w}=\sum_{n=1}^{10}2(\hat y^n-(b+w·x_{cp}^n))(-x_{cp}^n)$

$\frac {\partial l}{\partial b}=\sum_{n=1}^{10}2(\hat y^n-(b+w·x_{cp}^n))$

如何验证训练好的模型的好坏

求一元一次模型 $y=b+x_{cp}$ 平均误差：

$\frac {1}{10}\sum_{n=1}^{10} \lvert \hat y^n-(b+w·x_{cp}) \rvert$
求一元n次模型 $y=b+w_1 \cdot x_{cp}+w_2 \cdot x_{cp}^2$ 平均误差：
$\frac {1}{10}\sum_{n=1}^{10} \lvert \hat y^n-(b+w_1 \cdot x_{cp}+w_2 \cdot x_{cp}^2) \rvert$

过拟合问题

问题表现：在训练集上面表现更为优秀的模型，在测试集上效果却更差，即模型的泛化能力不行

解决方式：获取更多数据或是选择合适的模型

步骤优化

Step 1 ：2个input的四个线性模型是合并到一个线性模型中

$x_s=species~of~x \\if~x_s=Pidgey:~~~~~~y=b_1+w_1 \cdot x_{cp} \\if~x_s=Weedle:~~~~~~y=b_2+w_2 \cdot x_{cp} \\if~x_s=Caterpie:~~~y=b_3+w_3 \cdot x_{cp} \\if~x_s=Eevee:~~~~~~y=b_4+w_4 \cdot x_{cp}$