【线性回归_原理】

我们都知道,只含有一个自变量 x 和一个因变量 y,且二者的关系可用一条直线近似表示,则称为一元线性回归分析,形式为:
在这里插入图片描述

同理,包括两个或两个以上的自变量 x 和一个因变量 y,且因变量和自变量之间是线性关系,则称为多元线性回归分析,形式为:
在这里插入图片描述
如何确定一组最佳的参数
在这里插入图片描述
呢?那么会有人问什么是最佳参数呢?就是这组参数能够使我们预测出来的图片值与真实的图片值之间的差距最小,均方误差是回归问题中常用的性能度量指标,基于均方误差最小化来进行模型求解的方法称为“最小二乘法”。

基于以上思路,我们看一下下面这个问题。

问题:

假设我们有m个样本,每个样本有n个特征,并且已知每个样本对应的输出值y,形式为:在这里插入图片描述
求此样本的输出值是什么?(y是连续的,所以为回归问题)

分析:

我们假设模型是这样的:
在这里插入图片描述
其中,
在这里插入图片描述
损失函数为:
在这里插入图片描述
那么我们的问题就是,找到一组最佳的参数使得损失函数最小。我们令其导数等于0,求得的参数即为最佳参数。

求解:

1、代数法

我们假设n=1,即这m个样本都只有一个特征,那么
在这里插入图片描述
损失函数为:
在这里插入图片描述
我们分别对
图片
求导得:
在这里插入图片描述
求得参数值为:
在这里插入图片描述
同理,可以得出针对多个特征的样本拟合的最佳参数。

2、矩阵法

我们模型的矩阵形式为:

在这里插入图片描述
损失函数为:
在这里插入图片描述
展开后为:
在这里插入图片描述
对上式求导得:
在这里插入图片描述
即:
在这里插入图片描述
两边同时左乘
在这里插入图片描述
后,得参数为:
在这里插入图片描述

总结一下上面用到的矩阵相关知识:
在这里插入图片描述

=====================================================================
此外我还整理了一些线性回归相关的文章

【线性回归:为什么损失函数要使用均方误差】
【线性回归_案例代码(kaggle房价预测)】
【OLS回归_结果解读】
【多重共线性_影响&识别】

更多详细内容请关注我的公众号~
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值