### 基本统计分析 ################
install.packages("vcd")
install.packages("grid")
library(grid)
library(vcd)
head(Arthritis,50)
##生成频数表
mytable <- with(Arthritis,table(Improved))
#一维列联表
mytable
prop.table(mytable)
prop.table(mytable)*100
#二维列联表
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
prop.table(mytable)
#多维列联表
mytable <- xtabs(~ Treatment + Improved + Sex,data = Arthritis)
prop.table(mytable)
##独立性检验
#卡方独立性检验
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
chisq.test(mytable) #患者接受的治疗和改善的水平看上去存在着某种关系(p < 0.01)
#Fisher精确检验
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
fisher.test(mytable)
##相关性的度量
mytable <- xtabs(~ Treatment + Improved,data = Arthritis)
assocstats(mytable)
### 相关 ################
states <- state.x77[,1:6]
#协方差
cov(states)
#相关系数
cor(states) #Illiteracy和Murder很强的正相关0.703
#相关性的显著性检验
cor.test(states[,3],states[,5]) #这段代码检验了预期寿命和谋杀率的Pearson相关系数为0的原假设。假设总体的相关度为0, 则预计在一千万次中只会有少于一次的机会见到0.703这样大的样本相关度(即p = 1.258e08)。 6 由于这种情况几乎不可能发生,所以你可以拒绝原假设,从而支持了要研究的猜想,即预期寿命 和谋杀率之间的总体相关度不为0。
#计算相关矩阵并进行显著性检验
library(psych)
corr.test(states, use = "complete") #参数use=的取值可为"pairwise"或"complete"(分别表示对缺失值执行成对删除或行删 除)。
### t检验 ################
#接受某种新药治疗的患者是否较使用某种现 有药物的患者表现出了更大程度的改善?某种制造工艺是否较另外一种工艺制造出的不合格品 更少?两种教学方法中哪一种更有效?
##独立样本的t检验
library(MASS)
head(UScrime)
t.test(Prob ~ So, data = UScrime) #你可以拒绝南方各州和非南方各州拥有相同监禁概率的假设(p < .001)
##非独立样本的t检验
library(MASS)
with(UScrime, t.test(U1, U2, paired = TRUE )) #差异的均值(61.5)足够大,可以保证拒绝年长和年轻男性的平均失业率相同的假设。 年轻男性的失业率更高。事实上,若总体均值相等,获取一个差异如此大的样本的概率小于 0.000 000 000 000 000 22(即2.2e16)。
### 回归 ################
#用 lm()拟合回归模型
fit <- lm(weight ~ height, data = women)
plot(women$height, women$weight)
abline(fit)
### 单因素方差分析 ################
install.packages("multcomp")
library(mvtnorm)
library(survival)
library(TH.data)
library(multcomp)
attach(cholesterol)
head(cholesterol)
#各组样本大小
table(trt)
#各组均值
aggregate(response, by = list(trt), FUN = mean )
#各组标准差
aggregate(response, by = list(trt), FUN = sd )
#检验组间差异
fit <- aov(response ~ trt)
summary(fit) #从输出结果可以看到,每10个患者接受其中一个药物疗法 。均值显示drugE降低胆固醇最 多,而1time降低胆固醇最少 ,各组的标准差相对恒定,在2.88到3.48间浮动 。ANOVA对治 疗方式(trt)的F检验非常显著(p<0.0001),说明五种疗法的效果不同 。
R语言统计分析
最新推荐文章于 2022-11-06 14:19:03 发布