R语言统计分析

### 基本统计分析 ################
install.packages("vcd")
install.packages("grid")
library(grid)
library(vcd)
head(Arthritis,50)

##生成频数表
mytable <- with(Arthritis,table(Improved))
#一维列联表
mytable
prop.table(mytable)
prop.table(mytable)*100
#二维列联表
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
prop.table(mytable)
#多维列联表
mytable <- xtabs(~ Treatment + Improved + Sex,data = Arthritis)
prop.table(mytable)

##独立性检验
#卡方独立性检验
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
chisq.test(mytable)   #患者接受的治疗和改善的水平看上去存在着某种关系(p < 0.01)
#Fisher精确检验
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
fisher.test(mytable) 

##相关性的度量
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
assocstats(mytable)

### 相关 ################
states <- state.x77[,1:6]
#协方差
cov(states)
#相关系数
cor(states)  #Illiteracy和Murder很强的正相关0.703
#相关性的显著性检验
cor.test(states[,3],states[,5])   #这段代码检验了预期寿命和谋杀率的Pearson相关系数为0的原假设。假设总体的相关度为0, 则预计在一千万次中只会有少于一次的机会见到0.703这样大的样本相关度(即p = 1.258e08)。 6 由于这种情况几乎不可能发生,所以你可以拒绝原假设,从而支持了要研究的猜想,即预期寿命 和谋杀率之间的总体相关度不为0。
#计算相关矩阵并进行显著性检验
library(psych)
corr.test(states, use = "complete")   #参数use=的取值可为"pairwise"或"complete"(分别表示对缺失值执行成对删除或行删 除)。

### t检验 ################
#接受某种新药治疗的患者是否较使用某种现 有药物的患者表现出了更大程度的改善?某种制造工艺是否较另外一种工艺制造出的不合格品 更少?两种教学方法中哪一种更有效?
##独立样本的t检验
library(MASS)
head(UScrime)
t.test(Prob ~ So, data = UScrime) #你可以拒绝南方各州和非南方各州拥有相同监禁概率的假设(p < .001)
##非独立样本的t检验
library(MASS)
with(UScrime, t.test(U1, U2, paired = TRUE )) #差异的均值(61.5)足够大,可以保证拒绝年长和年轻男性的平均失业率相同的假设。 年轻男性的失业率更高。事实上,若总体均值相等,获取一个差异如此大的样本的概率小于 0.000 000 000 000 000 22(即2.2e16)。


### 回归 ################
#用 lm()拟合回归模型
fit <- lm(weight ~ height, data = women)
plot(women$height, women$weight)
abline(fit)


### 单因素方差分析 ################
install.packages("multcomp")
library(mvtnorm)
library(survival)
library(TH.data)

library(multcomp)
attach(cholesterol)
head(cholesterol)
#各组样本大小
table(trt)
#各组均值
aggregate(response, by = list(trt), FUN = mean )
#各组标准差
aggregate(response, by = list(trt), FUN = sd )
#检验组间差异
fit <- aov(response ~ trt)
summary(fit)  #从输出结果可以看到,每10个患者接受其中一个药物疗法 。均值显示drugE降低胆固醇最 多,而1time降低胆固醇最少 ,各组的标准差相对恒定,在2.88到3.48间浮动 。ANOVA对治 疗方式(trt)的F检验非常显著(p<0.0001),说明五种疗法的效果不同 。
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值