量纲对回归结果的影响_模型之母:多元线性回归

本文探讨了多元线性回归的理论与实现,包括如何处理具有多个特征的样本数据,通过正规方程解求解参数。文章强调了在多元线性回归中不需要对数据进行归一化处理,因为原始数据计算的参数不存在量纲问题。同时,提供了Python代码实现,并解释了线性回归算法的可解释性,即系数的正负和绝对值大小代表特征与预测目标的相关性和影响程度。
摘要由CSDN通过智能技术生成

0x00 前言

在线性回归的前3篇中,我们介绍了简单线性回归这种样本只有一个特征值的特殊形式,并且了解了一类机器学习的建模推导思想,即:

  1. 通过分析问题,确定问题的损失函数或者效用函数;
  2. 然后通过最优化损失函数或者效用函数,获得机器学习的模型。然后我们推导并实现了最小二乘法,然后实现了简单线性回归。最后还以简单线性回归为例,学习了线性回归的评价指标:均方误差MSE、均方根误差RMSE、平均绝对MAE以及R方。

但是,在真实世界中,一个样本通常有很多(甚至成千上万)特征值的,这就是多元线性回归。本篇内容我们学习多元线性回归并实现。

0x01 多元线性回归

对于下面的样本数据集  对应的是一个向量,每一行是一个样本,每列对应一个特征。对应的结果可以用如下如下公式: 

简单线性回归,只计算前两项,但是在多元线性回归中就要学习到n+1个参数,就能求出多元线性回归预测值: 

也就是:第一个特征与参数1相乘、第二个特征与参数2相乘,累加之后再加上截距。就能得到预测值。

求解思路也与简单线性回归非常一致,目标同样是:

已知训练数据样本、 ,找到,使  尽可能小.

其中  是列向量列向量,而且我们注意到,可以虚构第0个特征X0,另其恒等于1,推导时结构更整齐,也更加方便:

这样我们就可以改写成向量点乘的形式:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值