回归---李宏毅《机器学习》笔记02

最新推荐文章于 2024-01-02 20:55:31 发布

ppsswhite

最新推荐文章于 2024-01-02 20:55:31 发布

阅读量112

点赞数 2

分类专栏：李宏毅《机器学习》

本文链接：https://blog.csdn.net/ppsswhite/article/details/119788393

版权

5 篇文章 0 订阅

订阅专栏

前言

这章讲的是基础的回归，以前在金融工程系的很多课程都有学习到，所以学起来还是很快的，几乎没有新知识。

回归就是找到一个函数，通过输入特征x，输出一个数值

$y = b + w x$

$y=b+\sum w~i~x~i~$

$L(w,b)=(\sum| y-\hat{y}|)/n$
这里loss函数其实可以灵活定义
$MAE=(\sum| y-\hat{y}|)/n$
$MSE=(\sum| y-\hat{y}|)^2/n$

寻找使loss最小的参数组合
梯度下降
2.1 寻找一个初始参数组合值
2.2 计算loss函数对参数组合分别求微分，如果是负的，增加该参数的值，如果为正，减小该参数的值
2.3 更新参数组合
2.4 重复上述步骤，直到满足条件停止
学习率：梯度下降中参数移动的步长 $\eta$
$w^1 = w^0 - \eta dL/dw|_{w=w^0}$
梯度下降算法遇到的问题
4.1 stuck at local minima 即停留在loss函数的极小值点而非最小值点
4.2 stuck at saddle point 即停留在loss函数的鞍点而非最小值点
4.3 Stuck at local minima 即停留在loss函数的当前最优点

划分训练集测试集进行测试

$y=b+\sum_{i=0}^n w_i~x_1^i~$
如果把平方项看作一个特征，则它还是线性模型。

当不断提高模型的次方时，发现在训练集中表现更优秀的模型，在测试集中效果反而更差。

将多个模型合并到一个模型中
加入更多的特征，更多input。（如果数据量没增加，仍然会导致过拟合）
加入正则化
3.1 在2中加入更多特征，但可能某些特征的权值过高，仍然会导致过拟合，所以加入正则化
3.2 在损失函数后加上惩罚项 $\sum\lambda(w_i)^2$ ，能使参数更小，模型更平滑

希望能尽快学完上手实践

关注