1、模型
2、回归模型的假设检验
3、matlab编程
[b,bint,r,rint,stats]=regress(Y,X,alpha)
b:回归系数点估计
bint:回归系数区间估计
r:残差
rint:置信区间
stats:用于检验的统计量,有三个数值,相关系数r^2,F值,与F对应的概率p
alpha:显著性水平(缺省时为0.05)
说明:相关系数r^2越接近1,说明回归方程越显著;
F越大,说明回归方程越显著
与F对应的概率p<a(显著性水平),回归模型成立。
画出残差及其置信区间:
rcoplot(r,rint)
例
1.输入数据:
>>x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]';
>>X=[ones(16,1) x];
>>Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]';
2.回归分析及检验:
[b,bint,r,rint,stats]=regress(Y,X)
结果:
b =
-16.0730
0.7194
bint=
-33.7071 1.5612
0.6047 0.8340
r =
1.2056
-3.2331
-0.9524
1.3282
0.8895
1.1702
-0.9879
0.2927
0.5734
1.8540
0.1347
-1.5847
-0.3040
-0.0234
-0.4621
0.0992
rint=
-1.2585 3.6697
-5.0755 -1.3907
-3.6086 1.7037
-1.3085 3.9649
-1.8718 3.6508
-1.5750 3.9153
-3.7915 1.8157
-2.5680 3.1534
-2.2676 3.4144
-0.7730 4.4811
-2.7019 2.9713
-4.2379 1.0686
-3.0911 2.4831
-2.7860 2.7392
-3.1326 2.2084
-2.4826 2.6810
stats=
0.9282 180.9531 0.0000 1.7437
3.结果分析:
多元回归模型:y=-16.0730+0.7194x
β0的置信区间:【-33.7071 ,1.5612】,β1的置信区间:【0.6047 , 0.8340】
1.相关系数r^2是0.9282(趋近于1,显著性水平较高)
2.F值是180.9531(因为x共16个数据,自由度n-2为14,对照t(n)表,找到数据t(1,14)是4.60,而180.9531远大于4.60,所以完全有理由拒绝不显著的假设,即我们这个模型是显著的
3.与F对应的概率p是0.0000<显著性水平0.05,所以回归模型成立
4.做残差图:rcoplot(r,rint)
从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y=-16.073+0.7194x能较好的符合原始数据,而第二个数据可视为异常点.
4.预测及作图
z=b(1)+b(2)*x;
plot(x,Y, 'k+',x, z, 'r' )