数学建模—多元回归分析

EverydayOneCat

木星全貌🪐

img

知识点

1.笔记

image-20200707194734722

在了接受域中,接受X为0的假设,X对外没有比较显著的线性关系。

2.知识点补充

多元回归模型:含两个以上解释变量的回归模型

多元线性回归模型的假设:

  • 解释变量Xi 是确定性变量,不是随机变量
  • 解释变量之间互不相关,即无多重共线性
  • 随机误差项不存在序列相关关系
  • 随机误差项与解释变量之间不相关
  • 随机误差项服从0均值、同方差的正态分布

例题

1.多元线性回归

某品种水稻糙米含镉量y(mg/kg)与地上部生物量x1(10g/盆)及土壤含镉量x2(100mg/kg)的8组观测值如表。试建立多元线性回归模型。

image-20200707195415538

1.1SAS代码

data ex;
input x1-x2 y@@;
cards;
1.7 9.08 4.93 12 1.89 1.86
9.67 3.06 2.33 0.76 10.2 5.78
17.67 0.05 0.06 15.91 0.73 0.43
15.74 1.03 0.87 5.41 6.25 3.86
;
proc reg;
model y=x1 x2;
run;

1.2结果分析

image-20200707195937609

我们可以通过WORD将这些复制做成表格更加美观直接,每个表下面都需要有文字说明:

由方差分析表可知,其F value=386.30,pr>F的值<0.0001,远小于0.05,说明F值落在了拒绝域里面,故拒绝原假设,接受备择假设,认为y1与x1,x2之间具有显著性的线性关系;

image-20200707200529201

由参数估计表可知,x2对应的t值为1.61,Pr>|t|的值=0.1691,大于0.05,说明1.61落在了接受域中,接受x2为0的假设,x2对外没有比较显著的线性贡献。

为此,需要在程序中model y1=x1 x2中去掉x2,再次运行:

image-20200707200943602

对常数检验t值分别为t=37.53、,Pr>|t|的值<0.0001,远小于0.05,说明截距项通过检验,估计值为5.67953。
同理可知x1的系数通过检验,估计值为-0.32103

回归方程:y=-0.32103x1+5.67953

许多实际问题中可能还会出现某几个变量的系数并没有通过检验,此时,可以在原程序中的modely1=x1-x2中去掉没用通过的变量,直到所有的系数均通过检验。或者使用逐步回归方法,让软件自动保留通过检验的变量。

2.多元非线性回归

将非线性回归方程转化为线性回归方程。转化时应首先选择适合的非线性回归形式,并将其线性化。再确定线性化回归方程的系
数,最后确定非线性回归方程中未知的系数或参数。

湖北省油菜投入与产出的统计分析

1.投入指标
(1)土地(S)。土地用播种面积来表示。农作物播种面积是指当年从事农业
(2)劳动(L)。劳动用劳动用工数(成年劳动力一人劳动一天为一个工)来表示。劳动用工中包含着直接和间接生产用工。
(3)资本(K)。资本用物质费用来表示。物质费用包含直接费用和间接费用。主要有种子秧苗费、农家肥费、化肥费、农药费、畜力、固定资产折旧费和管理及其他费用等。

2.产出指标
产出指标用湖北省历年油菜生产的总产量(Y)来表示。

image-20200708100150053

2.1SAS代码

data ex;input y k s l t @@;
x1=log(k);x2=log(s);x3=log(l);y1=log(y);
cards;
70.8972 40076.5884 825.1305 15347.4273 1
83.7506 48008.7690 915.1500 15832.0950 2
70.8627 44593.8425 804.150 13306.8090 3
78.3451 43460.3229 783.2100 13314.5700 4
98.0749 72657.2633 923.8050 14596.1190 5
134.8767 146108.3421 1282.8900 20911.1070 7
147.5315 162433.3500 1244.7000 18670.5000 8
154.7607 166979.6325 1330.5150 18627.2100 9
159.9743 190395.5262 1505.4600 20775.3480 10
198.4942 205914.6645 1738.4100 22599.3300 11
194.7943 189762.7335 1677.0900 20963.6250 12
187.1013 193463.610 1761.9450 21936.2153 14
235.1184 183768.4035 1779.1500 19606.2330 15
;
proc reg;model y1=x1 x2 x3 t ; /*selection=stepwise*/
run;

2.2结果分析

image-20200708100655780

F值为145.06,对应的Pr>F的概率小于0.001,说明F值落在了拒绝域中。故拒绝原假设H0:x1,x2,x3x,t都为0,x1,x2,x3x,t对y1有显著的线性关系。

image-20200708101429697

这里我们遵循一个原则,先看变量,再看常数。变量如果要去,需要一个一个去,因为他们之间可能有线性关系,一个变量会影响另一个变量。

我们可以通过增加一段SAS代码查看变量之间的线性关系。

proc corr;var x1 x2 x3 t;

image-20200708102032701

可以看到,x1 x2 x3 t之间都有线性关系,这种其实是极不稳定的。

回到上面的表,我们看到常数显著性概率大于0.05,但是我们得先看变量,先不去管他。接着看x3,t都大于0.05很多,我们取最大的t显著性概率为0.9466,远大于0.05。因此将model y1=x1 x2 x3 t;去掉他,即改为model y1=x1 x2 x3 ;

image-20200708102331149

截距项Intercept(常数)的显著性概率为0.6117,大于0.05,因此将model y1=x1 x2 x3 ; 改为model y1=x1 x2 x3/noint;(去掉常数项)

image-20200708102702512

这时候F检验也过了,T检验也过了。我们可以得出式子:image-20200708102750386

F=34565.8 R2=0.9999 K,S,L的t值分别为(3.01) (6.59) (-9.98)

image-20200708102856861

但是我们通过经济学解释就会发现这个式子很不合理:K(资本)增长1%Y增长0.

  • 11
    点赞
  • 76
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值