统计学--基于R(第3版)(基于R应用的统计学丛书)作者:贾俊平 习题答案 第九章

9.1

#9.1
load("C:/exercise/ch9/exercise9_1.RData")
exercise9_1
#(1)绘制散点图,判断人均GDP与居民消费水平之间的关系,并计算相关系数分析其关系强度
library(car)
scatterplot(人均GDP~居民消费水平,data=exercise9_1,pch=19,xlab="居民消费水平",ylab="人均GDP",cex.lab=0.8)#pch决定点的样式
#由散点图可看出二者大概具有正的线性相关关系
cor(exercise9_1[,2],exercise9_1[,3])#计算相关系数
cor.test(exercise9_1[,2],exercise9_1[,3])#检验相关系数
#正线性相关且线性关系很强
#(2)以居民消费水平为因变量、人均GDP为自变量建立回归模型,并对回归模型进行综合评估
#回归模型的拟合
model<-lm(居民消费水平~人均GDP,data=exercise9_1)
summary(model)
#计算回归系数的置信区间
confint(model,level=0.95)
#输出方差分析表
anova(model)
#绘制拟合图
attach(exercise9_1)
model<-lm(居民消费水平~人均GDP)
plot(居民消费水平~人均GDP)
text(居民消费水平~人均GDP,labels=地区,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_1)
for(i in 1:n){segments(exercise9_1[i,3],exercise9_1[i,2],exercise9_1[i,3],model$fitted[i])}
mtext(expression(hat(y)==7.514e+02+3.194e-01%*%人均GDP),cex=0.7,side=1,line=-6,adj=0.75)
arrows(600,4900,550,5350,code=2,angle=15,length=0.08)

9.2

#9.2
load("C:/exercise/ch9/exercise9_2.RData")
exercise9_2
#(1)绘制产量与生产费用的散点图,判断二者之间的关系形态
library(car)
scatterplot(产量~生产费用,data=exercise9_2,pch=19,xlab="生产费用",ylab="产量",cex.lab=0.8)#pch决定点的样式
#正的线性相关关系
#(2)计算产量与生产费用之间的线性相关系数,对相关系数的显著性进行检验(α=0.05),并解释二者之间的关系强度
cor(exercise9_2[,2],exercise9_2[,3])#计算相关系数
cor.test(exercise9_2[,2],exercise9_2[,3])#检验相关系数
#cor=0.9202324,正线性相关,线性关系很强

9.3

#9.3
load("C:/exercise/ch9/exercise9_3.RData")
exercise9_3
#(1)用航班准点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义
#回归模型的拟合
model<-lm(投诉次数~航班准点率,data=exercise9_3)
summary(model)
#所以可得,hat(y)==430.1892+ -4.7006%*%航班准点率
#计算回归系数的置信区间
confint(model,level=0.95)
#输出方差分析表
anova(model)
#绘制拟合图
attach(exercise9_3)
model<-lm(投诉次数~航班准点率)
plot(投诉次数~航班准点率)
text(投诉次数~航班准点率,labels=航空公司编号,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_3)
for(i in 1:n){segments(exercise9_3[i,3],exercise9_3[i,2],exercise9_3[i,3],model$fitted[i])}
mtext(expression(hat(y)==430.1892-4.7006%*%航班准点率),cex=0.7,side=1,line=-6,adj=0.75)
arrows(600,4900,550,5350,code=2,angle=15,length=0.08)
#(2)检验回归系数的显著性(α=0.05)
#计算回归系数的置信区间
confint(model,level=0.95)
cor.test(exercise9_3[,2],exercise9_3[,3])#检验相关系数
#p-value = 0.001108<0.05,拒绝H0,认为显著
#(3)如果航班准点率为80%,估计顾客的投诉次数
h<-430.1892-4.7006*80.0
h
# 54.1412,即约为54次

9.4

#9.4
load("C:/exercise/ch9/exercise9_4.RData")
exercise9_4
#用广告费支出作自变量x,销售额作因变量y建立回归模型,并对模型进行诊断和评价
#回归模型的拟合
model<-lm(销售额~广告费支出,data=exercise9_4)
summary(model)
#计算回归系数的置信区间
confint(model,level=0.95)
#输出方差分析表
anova(model)
#绘制拟合图
attach(exercise9_4)
model<-lm(销售额~广告费支出)
plot(销售额~广告费支出)
text(销售额~广告费支出,labels=超市,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_4)
for(i in 1:n){segments(exercise9_4[i,3],exercise9_4[i,2],exercise9_4[i,3],model$fitted[i])}
mtext(expression(hat(y)==29.3991+1.5475%*%广告费支出),cex=0.7,side=1,line=-6,adj=0.75)
arrows(600,4900,550,5350,code=2,angle=15,length=0.08)
#诊断和评价
#计算残差和标准化残差
model<-lm(销售额~广告费支出,data=exercise9_4)
pre<-fitted(model)
res<-residuals(model)
zre<-model$residuals/(sqrt(deviance(model)/df.residual(model)))
data.frame(销售额=exercise9_4$销售额,点预测值=pre,残差=res,标准化残差=zre)
#绘制成分残差图
library(car)
crPlots(model)
#检验正态性
par(mfrow=c(2,2),cex=0.8,cex.main=0.7)
plot(model)
#Normal Q-Q图可见,在销售额与广告费支出的线性模型中,关于ε正态性的假定基本成立
#Residuals vs Fitted图可见,销售额与广告费支出的线性关系假定成立
#Scale-Location图,检验方差齐性
#方差齐性检验
ncvTest(model)
#绘制散布-水平图
spreadLevelPlot(model)
#检验独立性
#检验残差独立性
durbinWatsonTest(model)

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
清华大学出品的R语言全套课程PPT学习课件,非常适合大学生和职场人士学习,也适合老鸟复习回顾,完全可用于自学入门,很经典好用的PPT课件哦~ (1)清华大学精品数据科学R语言全套课程PPT课件含习题(26页) 第1章 R语言绪论(1) (2)清华大学精品数据科学R语言全套课程PPT课件含习题(27页) 第2章 R语言入门 (3)清华大学精品数据科学R语言全套课程PPT课件含习题(53页) 第3章 数据模型 (4)清华大学精品数据科学R语言全套课程PPT课件含习题(15页) 第4章 数据准备 (5)清华大学精品数据科学R语言全套课程PPT课件含习题(66页) 第5章 数据可视化 (6)清华大学精品数据科学R语言全套课程PPT课件含习题(35页) 第6章 数据探索 (7)清华大学精品数据科学R语言全套课程PPT课件含习题(38页) 第7章 数据变换 (8)清华大学精品数据科学R语言全套课程PPT课件含习题(20页) 第8章 高级编程 (9)清华大学精品数据科学R语言全套课程PPT课件含习题(63页) 第9章 数据建模 (10)清华大学精品数据科学R语言全套课程PPT课件含习题(25页) 第10章 数据评估 (11)清华大学精品数据科学R语言全套课程PPT课件含习题(21页) 第11章 影响大学平均录取分数线因素分析 (12)清华大学精品数据科学R语言全套课程PPT课件含习题(18页) 第12章 收视率分析 (13)清华大学精品数据科学R语言全套课程PPT课件含习题(18页) 第13章 RHadoop (14)清华大学精品数据科学R语言全套课程PPT课件含习题(25页) 第14章 Rspark

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值