多元统计分析上机题之R语言实现(多元正态分布)

引言

本学期也开了一门多元统计分析课程,也趁机想把课后上机题实现一遍,以增强理解。

教材使用的是约翰逊的《多元统计分析》第六版,中英文版教材、数据集、讲义见
还参考了王斌会老师的《多元统计分析及R语言建模》

本文内容主要为第4章多元正态分布的上机题,图略。
[rmd文档见](http://pan.baidu.com/s/1ntkuXQT
可以直接用Rstudio打开(之前先安装knitr包)

4.28

data_4.28<-read.table("E:\\研究生\\应用多元统计\\JohnsonWichern Data sets\\T1-5.DAT")
#正态Q-Q图
qqnorm(data_4.28$V2)
#正态性检验
#原始数据排序
new_data<-sort(data_4.28$V2)
length(new_data)
#对应概率值

prob<-function(i,n=42){
   #构建一个概率值的函数
  return((i-0.5)/n)
}
all_pro<-sapply(1:42,prob)#所有概率值
#对应的标准正态分位数
all_q<-qnorm(all_pro)
#Q-Q图的相关系数
rq<-cor(new_data,all_q)
#由于Q-Q图的相关系数rq为0.9693258,小于表4-2中n=40对应的临界点,所以拒绝正态性假设。

4.29

#(a)
#计算样本协方差矩阵
s<-cov(data_4.28[,5:6])
#s的逆
s_solve<-solve(s)
x_bar<-apply(data_4.28[,5:6],MARGIN=2,mean)#两列平均数
x_bar<-matrix(as.vector(x_bar),42,2,by=2)
two_col<-t(data_4.28[,5:6]-x_bar)#两列x-x_bar
#计算所用统计距离dis
dis<-c()
for(i in 1:length(two_col[1,])){
  dis[i]<-t(two_col[,i])%*%s_solve%*%two_col[,i]
}
####################################
#(b)
  • 17
    点赞
  • 88
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值