一、模型概念
·回归分析适用:确定两种或两种以上变量间相互依赖的定量关系,预测类
·一般步骤:1)确定回归方程中的自变量和因变量
2)确定回归模型,建立回归方程
3)对回归方程进行各种检验
4)利用回归方程进行预测
·观测值与估计值之间的是残差
·估计标准误差:为了度量回归方程的可靠性,度量观察值围绕着回归直线的变化程度或分散程度
·置信区间/预测区间
注:置信区间一般比预测区间小
·回归直线的拟合优度
注:1)ESS又称SSR,RSS又称SSE
2)总平方和分为回归平方和、残差平方和:TSS=ESS+RSS
·判定系数(,其值在0~1之间,约接近1,拟合程度越好)
1)一元线性回归 :
2)多元线性回归:
·显著性检验:分为线性关系检验和回归系数检验
·线性关系检验:检验x和y之间的线性关系是否显著,能否用一个线性模型表示
·均方回归MSR=ESS/k (k为回归自由度,即自变量的个数)
·均方残差MSE=RSS/n-k-1 (n-k-1残差自由度)
·F检验:
·显著性检验:目的是通过检验回归系数的值与0是否有显著性差异,来判断Y与X之间是否有显著的线性关系,,则总体回归方程中不含X项,Y与X之间不存在线性关系;如果,说明变量Y与X之间存在显著的线性关系
注:两种检验的关系:在一元线性回归中,二者等价;在多元线性回归中,线性关系检验只用于检验总体回归关系的显著性,回归系数检验可以对各个回归系数分别进行检验
·多重共线性的检验
二、一元线性回归的matlab代码:
%1、输入数据
%输入x的样本值
x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]';
%插入\beta0 对应的列
X=[ones(16,1) x];
%输入Y的样本值
Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]';
%2、回归分析及检验
[b,bint,r,rint,stats]=regress(Y,X);
%3、残差分析
rcoplot(r,rint)
%4、预测及作图
z=b(1)+b(2)*x
plot(x,Y,'k+',x,z,'r')
变量解释:
三、多元线性回归
变量解释:
代码与一元线性回归基本一致,区别在于X
X=[ones(size(x1)) x1 x2 x3];
·多元线性回归的逐步回归:判断所有对x对Y的显著性大小
stepwise(x,y)
消去0附近的变量,以增加显著性
完整代码:
%1、输入数据
%输入x的样本值
x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 7.0 6.0 7.5 7.8]';
x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]';
x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]';
x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]';
%插入\beta0 对应的列
X=[ones(size(x1)),x1,x2,x3,x4];
%输入Y的样本值
Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 89.6 132.4 189.6 190.4 210.3 180.5 190.6 204.6 209.5]';
%2、逐步回归
stepwise(X,Y)
%2、回归分析及检验
[b,bint,r,rint,stats]=regress(Y,X);
%3、残差分析
rcoplot(r,rint) %画残差图,评估拟合情况