Day6: Regression

最新推荐文章于 2021-07-14 22:49:42 发布

iCassiel

最新推荐文章于 2021-07-14 22:49:42 发布

阅读量137

点赞数

分类专栏：李宏毅机器学习

本文链接：https://blog.csdn.net/Ellamelody/article/details/96864710

版权

李宏毅机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

学习地址
 参考博客
Regression: output a scalar
举例
应用举例
Example Application
任务：预测宝可梦的CP值
在这里插入图片描述
上标表示一个object整体，下表表示一个object里的某些特征，不同的下标表示不同的feature。例如在本例中， $x_{cp}$ 表示宝可梦的战斗力CP， $x_h$ 表示宝可梦的身高， $x_s$ 表示宝可梦的种类。
步骤
Step 1: Model(a set of function)
在这里插入图片描述
w, b 为模型的参数，有的可能会不合理，需要自动挑出合理的function.

Step 2: Goodness of Function
评估函数
在这里插入图片描述
我们用Loss Function衡量function的好坏，
$L(f)=\sum_{n=1}^{10}(\hat{y}^n-f(x_{cp}^{n}))^2$
$\hat{y}^n$ –进化后的cp值，f–预测出来的结果
在本示例中，function包含参数 $w$ 和 $b$ ，因此loss function可表示为， $L(w,b)=\sum_{n=1}^{10}(\hat{y}^n-(b+w*x_{cp}^n))^2$
在这里插入图片描述
下图是在training data上的loss function

Step 3：Best Function
理论上，如果存在评估标准和函数空间，就可以使用穷举法选择出最优函数。但就实际而言，我们无法在有限时间内求出最优函数值。因此，我们把问题进行转化，把求最优函数问题转化为最优化问题。
在这里插入图片描述
Gradient Descent是一个更为general的方法，适用于各种不同的test，只要定义出Loss function，并且Loss function对输入参数 $w$ , $b$ 可微分。
假设如下情况，Loss function 只有一个参数 $w$ ：

利用gradient decent解决问题步骤如下：
（1）随机找一个参数位置 $w^0$
（2）计算 $\dfrac{dL}{dw}|_{w=w^0}$ ，若切线斜率为负，则增加 $w$ ；若为正，则减小 $w$ 。数学表达如下： $w^1\leftarrow w^0-\eta\dfrac{dL}{dw}|_{w=w^0}$
其中， $-\eta\dfrac{dL}{dw}|_{w=w^0}$
$\eta$ 称为学习率（learning rate），决定学习的速度。
（3）接下来计算 $\dfrac{dL}{dw}|_{w=w^1}$ ， $w^2\leftarrow w^1-\eta\dfrac{dL}{dw}|_{w=w^1}$
…Many iteration
直到， $-\eta\dfrac{dL}{dw}|_{w=w^T}=0$