[李宏毅机器学习课程笔记] 2. regression

最新推荐文章于 2024-07-19 16:33:18 发布

jswcsdn

最新推荐文章于 2024-07-19 16:33:18 发布

阅读量184

点赞数

分类专栏：李宏毅课程笔记文章标签：机器学习深度学习逻辑回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jswcsdn/article/details/124796444

版权

李宏毅课程笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1. 回归问题训练的基本步骤

ps: 也可以推广到其他问题的基本步骤

①选定合适的函数模型 ②对函数模型进行评估 ③梯度下降优化模型

1.1 选定函数模型

本例（宝可梦的进化后pc值的估计）选用的是线性模型，要待定的参数是w和b

1.2 对函数模型的评估

定义损失函数L，虽然形式会有不同，但描述的都正相关于真实值和估计值的差距

L是一个和w b相关的函数，本例中定义的是差值的平方和

1.3 梯度下降优化函数

随机梯度下降，随机选择初始值，确定初始值位置的斜率。斜率为正，初始值增加；斜率为负，初始值减小。因此，学习率之前为负号。所谓学习率指的是对于斜率的学习。进阶之后的算法，学习的未必只有该点处的斜率，可能还有全局或者局部的情况。

如果有两个参数，则是对偏导的学习。

以最简单的线性回归为例，线性回归是不会出现局部最优解的，只有全局最优解，偏导的结果就如同上式所示。

ps: 一些符号规定

$\widehat{y}$ 代表真实值或者标签

$f^{*}$ 代表最优的函数f

右上标n代表object 右下标代表属性

2. 不同模型的预测结果

（overfitting and regularization）

2个问题

未必模型越复杂，效果就越好。虽然在训练集上，模型越复杂，错误率越低，但是测试集却未必是这样。 ——overfitting

哪些因素是必须要考虑到模型之内的因素

对于第二个问题，可以直接考虑所有的因素，加特征，常常导致式子复杂，容易overfitting

解决方法，正则化，regularization

正则化增加了λ项，考虑 $w_{i}$ 的影响，使得 $w_{i}$ 尽可能得小，那么即考虑了各种因素，又使得各种因素的影响尽可能的小。一个平滑的曲线是更有可能正确的曲线。也未必λ要一味地大，过大了，各个w系数都会接近0，导致真正的特征没有考虑进去，模型欠拟合。λ有一个最佳值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[李宏毅机器学习课程笔记] 2. regression

李宏毅课程2020 B站p3
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。