多元统计分析及R语言建模(王斌会)第三第四章答案

3)要了解学校毕业生起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释。表4-7为某学校办公室提供的样本数据。

表4-7某学校学生起始工资、GPA及年龄数据

GPA

年龄

起始工资

2.95

3.40

3.20

3.10

3.05

2.75

3.15

2.75

22

23

27

25

23

28

26

26

25 500

28 100

28 200

25 000

22 700

22 500

26 000

23 800

1)试做回归模型并解释各系数;

> library(openxlsx)

> e4.3 = read.xlsx('E:/mvexer5.xlsx','E4.3')

> fm = lm(起始工资~ GPA + 年龄,data = e4.3)  #多元线性回归模型

> fm

在Rstudio中运行结果如下

图3.1建立回归模型

由运行结果知多元线性回归函数为:

起始工资 = -5213.1 + 8508.8*GPA + 181.6*年龄

解释:在GPA不变的情况下,年龄每增加一个单位,起始工资就增加181.6个单位;
在年龄不变的情况下,GPA每增加一个单位,起始工资增加8508.8个单位。

  1. 确定学生的GPA和年龄是否能真正用来解释起始工资样本的变化;

> summary(fm)   #检验回归系数

> (R4.3 = summary(fm) $ r.sq)  #显示多元线性回归模型决定系数

> (R4.4.3 = sqrt(R4.3))  #显示多元数据复相关系数

在Rstudio中运行结果如下:

图3.2检验回归模型

R2= Multiple R-squared=0.6677不接近1,说明回归方程拟合度低,学生的GPA和年龄不能真正用来解释起始工资样本的变化

(3)预测某GPA为3.00,年龄为24岁的毕业生的起始工资。

> predict(fm,newdata = data.frame(GPA = 3,年龄 = 24))

在R语言中运行结果如下:

图3.3预测起始工资

4)研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。有关数据见表4-8

  1. 计算y,x1,x2,x3的相关系数矩阵并绘制矩阵散点图

> library(openxlsx)

> e4.4 = read.xlsx('E:/mvexer5.xlsx',sheet = 'E4.4')

> cor(e4.4)  #y,x1,x2,x3的相关系数矩阵

> cor(e4.4[,-1])  #去除y后的相关系数矩阵

> pairs(e4.4)  #绘制矩阵散列图

用Rstudio运行如下:

图4.1相关系数矩阵

 

图4.2矩阵散列图

(2)求y关于x1,x2,x3的多元线性回归方程

> fm <- lm(y ~ x1 + x2 + x3,data = e4.4)

> summary(fm)

在Rstudio中运行结果如下:

QQ截图20211111233307

图4.3多元线性回归方程

(6)使用逐步回归分析的逐步筛选方法获得一个最优的回归模型

> fm.step = step(fm,direction = 'both') #逐步筛选法变量选择结果

在Rstudio中运行结果如下:

QQ截图20211111233915

图4.4逐步筛选回归模型

3)某银行从历史贷款客户中随机抽取16个样本,根据设计的指标体系分别计算他们的“商业信用支持度”(x1)和“市场竞争地位等级”(x2),类别变量G中,1代表贷款成功,2代表贷款失败。数据如表5-11所示

(1)为了给正确贷款提供决策支持,请建立Logistic模型进行分析;

> library(openxlsx)

> e5.3 = read.xlsx('E:/mvexer5.xlsx',sheet = 'E5.3')

> logit.glm = glm(G ~ x1 + x2,data = e5.3) #建立Logistic模型

> summary(logit.glm)

在Rstudio中运行结果如下:

QQ截图20211111235632

图5.1Logistic模型分析

由运行结果知logistic拟合的模型x1的P>0.05,x2的P<0.05,说明有影响

(2)根据建立的模型,判定是否给某用户(x1 = 131,x2 = -2)提供贷款。

> logit.step <- step(logit.glm,direction = 'both') #逐步筛选法变量选择

> summary(logit.step)

> predict(logit.glm,data.frame(x1 = 131,x2 = -2))

> predict(logit.step,data.frame(x1 = 131,x2 = -2))

在Rstudio中运行结果如下:

QQ截图20211112001229

图5.2判定是否提供贷款

由运行结果知,预测值为2,表示贷款失败,不会给用户(x1 = 131,x2 = -2)提供贷款。

  • 11
    点赞
  • 98
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 很抱歉,我没有多元统计分析R语言建模第五版课后答案。作为一名语言模型,我的任务是提供各种主题的信息和帮助回答各种问题,而不是提供课本答案。如果您对多元统计分析R语言建模有任何问题,我很乐意为您提供帮助。 ### 回答2: 《多元统计分析r语言建模第五版》是一本针对多元统计分析r语言建模的教材,分为理论知识和实战案例两部分,是一本较为全面的理论和实践相结合的教材。而《多元统计分析r语言建模第五版》课后答案就是这本教材的理论和实践的检验和巩固。 这本教材的课后答案包含了每一章节的关键思路、计算、结果分析和讨论等方面的内容,为学生提供了重要的检验和巩固手段。其中,第一、二章主要介绍了数据类型、数据质量的评估、统计推断等基础知识,第三、四章介绍了双样本t检验、方差分析等基本假设检验方法,第五、六章介绍了协方差分析、回归分析等经典的多元统计方法,第七、八章介绍了主成分分析、聚类分析等高级分析方法。 而在每一章的课后答案中,不仅包含了每道题的计算过程和结果分析,还加入了针对题目及其相关内容讨论的补充说明,对学生更好地理解相关内容有很大的帮助。此外,一些重要的实战案例也会有课后答案的详细解释,较高地增强了学生的实践应用能力。 总之,多元统计分析r语言建模第五版课后答案是这本教材的重要组成部分,为学生对理论和实践的深度学习提供了很大的帮助,有利于更好地掌握多元统计分析r语言建模的实践技能。 ### 回答3: 《多元统计分析R语言建模(第五版)》是一本重要的统计学教材。其中包含许多关于多元统计分析R语言建模的理论知识和实践技巧。针对其中的课后习题,我们可以通过认真学习课本内容,灵活运用统计方法和R语言工具,来提高自己的分析能力。 在《多元统计分析R语言建模(第五版)》中,第一章介绍了多元统计分析的基本概念和方法。随着计算机技术的不断发展,多元统计分析在不同领域中的应用越来越广泛。比如,在社会科学领域中,我们可以通过回归分析来探究变量间的关系,或者使用主成分分析等方法进行变量降维。在生物医学领域中,我们可以使用聚类分析来识别不同细胞群,或者使用因子分析来研究疾病发生的原因。此外,多元统计分析也被广泛应用于企业决策、金融风险控制、电商推荐等领域。 在第二章中,我们学习了R语言编程的基础知识。R语言具有丰富的数据处理和统计分析函数库,以及灵活的数据可视化功能。熟练掌握R语言编程技能对于进行统计分析和数据挖掘是非常重要的。 在之后的章节中,我们学习了许多常用的多元统计分析方法,包括多元线性回归分析、判别分析、主成分分析、聚类分析、因子分析等。对于每一种方法,都有相关的R代码和真实数据案例进行练习。通过自己动手编程并进行真实数据分析,我们可以更好地理解和掌握这些多元统计分析方法,并在实践中不断提高自己的分析能力和解决问题的能力。 最后,我想说的是,《多元统计分析R语言建模(第五版)》是一本非常实用的统计学教科书,适合于各种领域的统计学学习者。通过认真学习课本内容,灵活运用统计方法和R语言工具,我们可以在数据分析和统计建模方面不断提高自己的能力和水平。同时,也希望教材的书中答案对于大家的学习有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值