（一）线性回归（原理）

Vic.GoodLuck

已于 2022-08-28 21:11:48 修改

阅读量817

点赞数

文章标签：线性回归算法回归

于 2022-05-01 22:22:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50533561/article/details/124502625

版权

机器学习笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

本文介绍了线性回归中的误差项分析，假设误差项服从高斯分布，通过推导得到似然函数，并转化为对数似然函数。利用梯度下降法寻找最小化损失函数的参数，探讨了批量梯度下降法中batch大小对结果的影响，以及学习率的选择策略。

摘要由CSDN通过智能技术生成

为参数项，为误差项（表示真实值和预测值的误差）

误差项服从高斯分布

代入=Y-X，得

所有项相乘得似然函数，越大表示预测值和真实值越接近

取对数得对数似然函数，累乘转换为累加，同样求函数值最大时的参数项

为了让似然函数取到极大值，我们需要将其中带参部分取得最小值

为了寻找取得最小值的参数，用最小二乘法求解

对变形

对求偏导

对于线性回归问题我们可以直接令偏导等于0，然后解出参数，但是线性回归是个特例，对于更多的问题我们需要引入——梯度下降法

定义（整体）损失函数

其中为多维参数

对某参数求偏导，得到梯度

该参数向梯度的反方向进行更新

注意：梯度更新采用批量梯度下降的方法，也就是计算时的m为一个batch的样本，batch选的越大，结果越精确，但速度越慢，batch选的小速度快，但不一定精确。通常使用较小batch的梯度下降，batch一般采取2的次幂

关于梯度下降的步长，我们将其称为学习率（LR）

大多情况来看，学习率应该设置得比较小，一般为0.01，0.001

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Vic.GoodLuck 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。