转:线性回归标准化与R、T、F

转自:https://blog.csdn.net/jinruoyanxu/article/details/51628441?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control

1、标准化

对于多元线性回归需要对各个自变量进行标准化,排除单位的影响。

标准化方法:即将原始数据减去相应变量的均数后再除以该变量的标准差,而标准化得到的回归方程称为标准化回归方程,相应得回归系数为标准化回归系数。

2、T检验

T检验是对各个回归系数的检验,绝对值越大,sig就越小,sig代表t检验的显著性,在统计学上,sig<0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效预测因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。

3、F检验

F检验是对所有回归系数的检验,代表你进行回归的所有自变量的回归系数的一个总体检验,如果sig<0.05,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以写出。

F检验和R平方同向变化,当R方=0时F=0;

当R方越大,F值也就越大

当R方=1时,F为无穷大。

F检验是所有回归系数的总显著性的度量也是R方的显著性检验,即检验回归系数为0 等价于R方为0,也就是在计算R方后,就不必做F检验。

另外对于一元线性回归,F检验等价于T检验,因为回归系数只有一个。

4、R方

对于每组数据,我们可以用最小二乘法来求得一个线性模型,但对于这个模型的效果如何,如何来比较模型之间的好坏呢。R方就是来处理这个问题,它可以来计算预测值和真实y值的匹配程度,当R方(0~1)越接近1,这线性关系越明显。

而在使用的时候要用调整后的R方,这个值是针对自变量的增多会不断增强预测力的一个矫正(因为即使没什么用的自变量,只要多增几个,R方也会变大,调整后的R方是对较多自变量的惩罚),R可以不用管,标准化的情况下R也是自变量和因变量的相关

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值