多元线性回归模型

本文探讨了多元线性回归模型的原理,包括使用正规方程求解、模型显著性检验(F检验和t检验)、以及如何在实际应用中通过Python实现。文章指出,F检验用于检验整个回归关系的显著性,t检验则评估单个变量的重要性。通过F值和t统计量的P-value判断模型和变量的显著性,通常设定显著性水平为0.05。模型诊断和代码实现部分尚未展开。
摘要由CSDN通过智能技术生成

线性回归模型就属于监督学习里的回归模型。线性回归是通过属性的线性组合进行预测的函数,一元线性回归较为简单。这里我们主要介绍多元回归的直接解法------正规方程

在这里插入图片描述
在这里插入图片描述
可以表示为
在这里插入图片描述
且可求出,若要满足误差项最小:即将y投影到X上
在这里插入图片描述

注意这里若要使X’X可逆,必须满足x列向量线性无关。但但数据量很大的时候,很难满足,我们往往采用PCA或求伪逆

再得到模型后,我们还要进模型检验,验证模型的准确性:

t检验常能用作检验回归方程中各个参数的显著性,而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释变量分别对被解释变量有显著的线性关系

模型显著性检验(F检验)和系数显著性检验(t检验)

在这里插入图片描述
在对F的定义中,由于SSR和SSE之和是个定值,两者负相关。当SSE最小时,模型吻合最好。计算出F。再与理论值F比较。
回归系数显著性检验的出发点就是为了验证每一个变量是否能够成为重要因素。在这里插入图片描述
每一个偏回归系数的t统计值,对应着概率值p,p小于0.05着拒绝原假设,否则,没通过显著性检验的变量不是影响利润的重要

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值