湖北省油菜投入与产出的统计分析
1.投入指标:资本(K),土地(S),劳动(L);
2.产出指标:总产量(Y),
建立模型:
转化为四元线性回归问题。
代码:
clear
clc
A=xlsread('youcai.xlsx','B2:E14');
B=xlsread('youcai.xlsx','F2:F14');
x1=log(A(:,2));
x2=log(A(:,3));
x3=log(A(:,4));
xa=cat(2,x1,x2,x3);
xb=cat(2,x1,x2,B);
x=cat(2,xa,B);
y=log(A(:,1));
stats=reglm(y,x,'linear');
------------------------------------方差分析表------------------------------------
方差来源 自由度 平方和 均方 F值 p值
回归 4.0000 2.1179 0.5295 138.7729 0.0000
残差 8.0000 0.0305 0.0038
总计 12.0000 2.1484
均方根误差(Root MSE) 0.0618 判定系数(R-Square) 0.9858
因变量均值(Dependent Mean) 4.8545 调整的判定系数(Adj R-Sq) 0.9787
-----------------------------------参数估计-----------------------------------
变量 估计值 标准误 t值 p值
常数项 0.9026 2.1418 0.4214 0.6846
X1 0.2412 0.1020 2.3652 0.0456
X2 1.3529 0.6549 2.0656 0.0727
X3 -0.8592 0.6563 -1.3091 0.2269
X4 -0.0058 0.0324 -0.1804 0.8613
F检验中p值<0.1
结论:t,lnK,lnS,lnL中至少有一个与lnY的关系显著。
t检验中x4的p值最大
结论:x4也就是t与y的关系最不显著,,所以要剔除变量x4。
去除x4后:
stats=reglm(y,xa,'linear');
------------------------------------方差分析表------------------------------------
方差来源 自由度 平方和 均方 F值 p值
回归 3.0000 2.1178 0.7059 207.3037 0.0000
残差 9.0000 0.0306 0.0034
总计 12.0000 2.1484
均方根误差(Root MSE) 0.0584 判定系数(R-Square) 0.9857
因变量均值(Dependent Mean) 4.8545 调整的判定系数(Adj R-Sq) 0.9810
-----------------------------------参数估计-----------------------------------
变量 估计值 标准误 t值 p值
常数项 0.6976 1.7154 0.4067 0.6937
X1 0.2337 0.0881 2.6534 0.0263
X2 1.2416 0.2082 5.9625 0.0002
X3 -0.7529 0.2733 -2.7543 0.0223
常数没有通过检验,但在统计模型中不要轻易去掉常数。
可得回归方程:
用逐步回归再做一遍:
inmodel=1:3;
stepwise(x,y,inmodel);
图中的逐步回归过程也是将x4忽略了。
但是,实际上,x3和x4去掉哪一个都可以。
>> [xs,p]=corrcoef(x)
xs =
1.0000 0.9565 0.9267 0.9020
0.9565 1.0000 0.9420 0.9472
0.9267 0.9420 1.0000 0.7979
0.9020 0.9472 0.7979 1.0000
p =
1.0000 0.0000 0.0000 0.0000
0.0000 1.0000 0.0000 0.0000
0.0000 0.0000 1.0000 0.0011
0.0000 0.0000 0.0011 1.0000
由图中可得x3与x4之间存在线性关系,所以也可以忽略x3,保留x4。
stats=reglm(y,xb,'linear');
------------------------------------方差分析表------------------------------------
方差来源 自由度 平方和 均方 F值 p值
回归 3.0000 2.1114 0.7038 170.9072 0.0000
残差 9.0000 0.0371 0.0041
总计 12.0000 2.1484
均方根误差(Root MSE) 0.0642 判定系数(R-Square) 0.9827
因变量均值(Dependent Mean) 4.8545 调整的判定系数(Adj R-Sq) 0.9770
-----------------------------------参数估计-----------------------------------
变量 估计值 标准误 t值 p值
常数项 -1.4450 1.2166 -1.1878 0.2653
X1 0.1785 0.0935 1.9086 0.0887
X2 0.5637 0.2659 2.1199 0.0630
X3 0.0322 0.0148 2.1716 0.0580
可得回归方程:
这个模型存在着高度的多重共线,模型还是属于病态模型。