描述性统计和假设检验,首先介绍因子,然后介绍如何计算常用描述性统计量、偏度、峰度、相关系数及列联表,假设检验部分依次介绍了正态性分布检验、方差齐性检验、t检验、方差分析以及常用非参数检验。
######################################################
# 因子
set.seed(42)
l3 <-sample(letters[1:3], 10, replace = T)
l3
as.factor(l3)
factor(l3)
# factor()
# 描述性统计
set.seed(432)
d3 <- data.frame(
ind = 1:1000,
rn = rnorm(1000),
rn2 = rnorm(1000, mean = 2, sd = 3),
rt = rt(1000, df=5),
rs1 = as.factor(sample(letters[1:3], 1000, replace = T)),
rs2 = as.factor(sample(LETTERS[21:22], 1000, replace = T))
)
# 描述性统计结果
summary(d3)
library(skimr)
skim(d3)
# 偏度
e1071::skewness(d3$rn)
# 峰度
e1071::kurtosis(d3$rn2)
# 相关系数
cor(d3$rn, d3$rt)
cor(d3[,2:4])
# 相关性检验
cor.test(d3$rn, d3$rt)
library(psych)
corr.test(d3[,1:3])
# 列联表
table(d3$rs1)
prop.table(table(d3$rs1))
######################################################
# 假设检验
# 正态分布检验
# shapiro.test()
library(rstatix)
head(ToothGrowth)