从零开始深度学习 T1. Regression Case Study

最新推荐文章于 2024-06-29 14:04:37 发布

myta0424

最新推荐文章于 2024-06-29 14:04:37 发布

阅读量543

点赞数

分类专栏：深度学习文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/u011033990/article/details/77926251

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

回归分析

回归分析(Regression analysis)是统计学的一个概念，用来估计各个变量之间的关系。
机器学习中常见的回归分析类型有：

Linear Regression 线性回归
Logistic Regression逻辑回归

机器学习中的回归分析大体可以用 $y=f(x)$ 来表示，即给定输入量 $x$ ，得出输出结果 $y$ ，其中函数 $f$ 是根据已有的数据进行拟合的结果。
李宏毅教授的课上讲了一个比较有意思的例子——根据Pokemon的已有参数(如cp、生命值、身高、体重)等，预测Pokemon进化后的cp值。
整个回归分析分为三个步骤：

通过建立Model，定义function set
定义什么样的function是好的
从function set中选出最好的function

下面分别进行阐述

1. 通过建立Model，定义function set

课程中采用了经典的linear model，这也是一个入门级的model：

y = b + \sum w i x i

$y=b+\sum{w_ix_i}$
其中

xi $x_i$ 代表Pokemon的属性，

wi $w_i$ 是权重，

b $b$ 是bias，事实上每一组不同的

wi $w_i$ 与

b $b$ 都可以定义出一个function，这就构成了function set。

2. 定义什么样的function是好的

首先考虑 $w$ 是标量的简单情况，在本例中，预测cp值误差小的function是好的。我们定义一个Loss function用来表示预测值与实际值之间的差距。那么就有

L (f) = L (w, b) = \sum n = 1 10 (y^- (b + w \cdot x n c p)) 2

$L(f)=L(w,b)=\sum^{10}_{n=1}{(\hat{y} - (b + w \cdot x^{n}_{cp}))^2}$

3. 从function set中选出最好的function

从function set中选出 $L(f)$ 最小的function即为最好的function，其中 $w$ 与 $b$ 为自变量。梯度下降(Gradient Descent)是解决该问题的一个非常有效的方法。其过程就是沿梯度下降的方向进行参数更新，从而求解极小值时的参数（也可以沿梯度上升方向求解极大值时参数），用数学公式表示为：

θ \leftarrow θ - η \nabla L

$\theta \leftarrow \theta - \eta\nabla L$
其中

θ $\theta$ 代表需要优化的参数，

η $\eta$ 代表每一次进行参数更新的步长，

∇L $\nabla L$ 代表函数

L $L$ 的梯度(对各个参数进行偏微分组成的向量)。在本例中，

θ = [w b]

$\theta=\begin{bmatrix} w \\ b \end{bmatrix}$

\nabla L = ⎡ ⎣ ⎢ ⎢ \partial L \partial w \partial L \partial b ⎤ ⎦ ⎥ ⎥

$\nabla L = \begin{bmatrix} \frac{\partial L}{\partial w} \\ \frac{\partial L}{\partial b} \end{bmatrix}\quad$
最后得出的拟合结果为

模型的选择

Overfitting

之前我们只考虑了 $w$ 是标量的情况，在 $w$ 是一个矢量时，比如

w = [w 1, w 2]

$w=[w_1, w_2]$
那么就有

y = b + w 1 \cdot w 2 + w 2 \cdot x 2 c p

$y=b+w_1 \cdot w_2 + w_2 \cdot x^2_{cp}$
此时拟合结果为

更进一步

y = b + w 1 \cdot w 2 + w 2 \cdot x 2 c p + w 3 \cdot x 3 c p

$y=b+w_1 \cdot w_2 + w_2 \cdot x^2_{cp} + w_3 \cdot x^3_{cp}$

y = b + w 1 \cdot w 2 + w 2 \cdot x 2 c p + w 3 \cdot x 3 c p + w 4 \cdot x 4 c p

$y=b+w_1 \cdot w_2 + w_2 \cdot x^2_{cp} + w_3 \cdot x^3_{cp} + w_4 \cdot x^4_{cp}$

. . .

$...$
当多项式的次数过高时，会存在 过拟合(Overfitting)的问题。在过拟合时，模型过度拟合训练样本，失去一般性，从而在训练样本上面的误差很小，但是在检测样本上面的误差很大。如下图所示，在多项式的次数增大的时候，Training data上面的误差不断减小，然而Testing data上面的误差先减小，后急剧增大。

overfitting

hidden factors

除了进化之前的 $x_{cp}$ 值，进化之后的 $x_{cp}$ 值还可能受Pokemon的种类、高度、重量等影响，这些参数都可以用来redesign model。

regularization

为了让模型拟合的曲线更加平滑，我们可以让模型的参数尽可能变小。为此可以在Loss function中加入参数大小的影响因子，如下公式

L (f) = L (w, b) = \sum n = 1 10 (y^- (b + w \cdot x n c p)) 2 + λ \sum (w i) 2

$L(f)=L(w,b)=\sum^{10}_{n=1}{(\hat{y} - (b + w \cdot x^{n}_{cp}))^2} + \lambda \sum(w_i)^2$
更加平滑的function受参数的影响较小。(If some noises corrupt input when testing, a smoother function has less influence)

总结

本文主要介绍了回归分析以及建模步骤，涉及到的新概念有Gradient decent、Overfitting、Regularization等。

myta0424

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从零开始深度学习 T1. Regression Case Study

回归分析回归分析(Regression analysis)是统计学的一个概念，用来估计各个变量之间的关系。机器学习中常见的回归分析类型有：Linear Regression 线性回归Logistic Regression逻辑回归机器学习中的回归分析大体可以用y=f(x)y=f(x)来表示，即给定输入量xx，得出输出结果yy，其中函数ff是根据已有的数据进行拟合的结果。李宏
复制链接

扫一扫