线性回归分析
1.背景
课后作业.涉及矩阵运算,回归关系的统计推断
教材:<数据分析>科学出版社 第二版
2.作用:计算方差分析表
3.参考
4.代码(matlab)
function [SST,SSR,SSE,beta,H] = regress_analysis(y,x)
n=length(x);
a = ones(n,1);
x=[a,x];
H=x*inv(x'*x)*x';
J = ones(n);
SSR =y'*(H-1/n*J)*y;
SSR = vpa(SSR);
I =eye(n);
SST=y'*(I-1/n*J)*y;
SST = vpa(SST);
SSE=y'*(I-H)*y
beta = inv(x'*x)*x'*y
end
2.带入数据
代码如下(示例):
format rat
x = [-2 0 1 2 4]';
y = [-9 -2 1 2 3]';
p=2%自由度为1,因为只有一个变量x
n=5%数据量,可理解为单列数据数
[SST,SSR,SSE,beta,H]=regress_analysis(y,x)
MSR = SSR/(p-1);
MSE=SSE/(n-p);
list = [SSR,MSR;SSE,MSE;SST,0]
输出:
第一列为各平方和,第二列为各均方
总结
判断变量X与Y之间是否存在显著的线性回归关系.作
H 1 H_1 H1假设:至少有某个 b e t a beta beta不等于 0 0 0.
给定显著性水平 a l p h a alpha alpha,由F分布得临界 F ( p − 1 , n − p ) F(p-1,n-p) F(p−1,n−p),计算 F F F的观测值 F 0 F_0 F0,若 F 0 < = F ( p − 1 , n − p ) F_0<=F(p-1,n-p) F0<=F(p−1,n−p),接受 H 0 H_0 H0,即在显著水平 a l p h a alpha alpha之下,认为线性回归关系不显著;反之,拒绝 H 0 H_0 H0,认为X与Y线性关系显著.
F = M S R / M S E F=MSR/MSE F=MSR/MSE