学习笔记-Regression

最新推荐文章于 2022-03-01 16:55:45 发布

宅家做贡献

最新推荐文章于 2022-03-01 16:55:45 发布

阅读量175

点赞数

分类专栏：机器学习-学习笔记文章标签：机器学习 regression

本文链接：https://blog.csdn.net/somehappyness/article/details/97615158

版权

机器学习-学习笔记专栏收录该内容

0 篇文章 0 订阅

订阅专栏

本文介绍了回归分析的基本概念，包括输出一个标量的预测任务、模型构建、函数优度衡量以及最佳函数的选择。通过示例展示了如何使用梯度下降法寻找最小化损失函数的最佳参数w和b，探讨了线性回归中局部最优的问题。

摘要由CSDN通过智能技术生成

Regression

Output a scalar

自变量X（input）
因变量Y（output）
寻找一个函数（function），他的output为一个数值，这种任务就叫 Regression

Example Application

Step1 Modle

Modle 本质上是 A set of function （f₁，f₂ ，f₃ …）
例如这个model：
y=b+w * x_cp
这里的b，w 可以是任何数值。带入不同的值，可以得到不同的funtion：
$f1 : y = 9.0 + 9.0 * x_{cp}$
$f2 : y = 9.8 + 9.2 * x_{cp}$
$f3 : y = -0.8 - 1.2 * x_{cp}$
$. . . . . . . i n f i n i t e < / c e n t e r >$

这些function 组成了一个 a set of funtion （及modle），这个model 为 Linear modle ,表示为：
$y = b + w_ix_i$

Step2 Goodness of Function

使用另外一个function 衡量我们衡量function 的好坏，即 loss function （L）
input ： a function
output：how bad it is
$\sum_{i=1}^{n}(\hat y ^n - f(x^n_{cp}))^2$
即实际值与评估值的差距取平方累加
f 是关于 w 和 b 的，那么 L是关于 f的，即 L也是关于 w和b的，这个等式可以等同于：
$\sum_{i=1}^{n}(\hat y ^n - (b+ w *x^n_{cp}))^2$

Step3 Best Function

Best Function 即 L(f) 最小的时候
$f^* = arg minL(f)$
$min_{w,b}\sum_{i=1}^{n}(\hat y ^n - (b+ w *x^n_{cp}))^2$
解决这个问题的方法为 Gradient Descent

Gradient Descent

consider loss function L(w) with one parameter w:

$w^* = arg min_wL(w)$

pick an intial value $w^0$ randomly
compute $\frac{dL}{dw}| _{w=w^0}$ ;计算得到新的 w : $w1\leftarrow w^0- \eta\frac{dL}{dw}| _{w=w^0}$ ( $\eta$ 为 learning rate ,为一个常数)
compute $\frac{dL}{dw}| _{w=w^1}$ ;计算得到新的 w : $w2\leftarrow w^1- \eta\frac{dL}{dw}| _{w=w^1}$
many iteration

consider loss function L(w) with one parameter w, b :

$w^*,b^* = argmin_{w,b}L(w,b)$

pick intial value $w^0$ ， $b^0$ randomly
compute $\frac{\partial{L}}{\partial{w}}| _{w=w^0,b=b^0}$ ; $\frac{\partial{L}}{\partial{b}}| _{w=w^0,b=b^0}$ 计算得到 $w^1,b^1$
compute $\frac{\partial{L}}{\partial{w}}| _{w=w^1,b=b^1}$ ; $\frac{\partial{L}}{\partial{b}}| _{w=w^1,b=b^1}$ 计算得到 $w^2,b^2$
many iteration
将参数偏导数放在一起排成vector （即 gradient） $\Delta L =\Bigg[{\frac{\partial{L}}{\partial{w}} \atop \frac{\partial{L}}{\partial{w}}}\Bigg]$

在这里插入图片描述存在问题： loss function 的求解容易陷入局部最优，但是 liner regression 不用太担心，因为函数是一个碗的形状，最后会达到最低点

宅家做贡献

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习笔记-Regression

RegressionOutput a scalar自变量X（input）因变量Y（output）寻找一个函数（function），他的output为一个数值，这种任务就叫 RegressionExample ApplicationStep1 ModleModle 本质上是 A set of function （f1，f2 ，f3 …）例如这个model：y=b+w * xcp...
复制链接

扫一扫

专栏目录