一、随机数模拟
1. 一元随机数
一维随机数,一个向量
1)二项分布
伯努利试验
rbinom()
2)泊松分布
离散型随机变量
rpois()
3)正态分布
rnorm()
4)均匀分布
连续型随机变量
runif()
5)卡方分布
rchisq()
6)t分布
7)F分布
注意:MASS包中,fitdistr()函数使用极大似然估计来拟合单变量数据的分布,它根据随机数和指定分布类型来估计随机数参数。
2. 多元随机数
一般可看成一个矩阵:行表示样本数量,列表示随机数的维度。
MASS包,mvrnorm()可生成多元正态分布的随机数。
kde2d()可估计二元正态分布的核密度(概率密度函数)
二、假设检验
1. 数据分布检验
是非参数检验,根据样本值来判断总体是否服从某种指定的分布
chisq.test() 进行Pearson拟合优度卡方检验
ks.test() 进行K-S检验
shapiro.test() Shapiro-Wilk正态分布性检验
Q-Q图检验:rnorm()、qqnorm()
2. 均值的检验
1)t检验:总体均值检验
单样本t检验
两独立样本t检验
2)方差齐性检验
检验不同样本的总体方差是否相同
检验方法:F检验、Bartlet检验、Levene检验
var.test()、bartlett.test()、leveneTest()
F检验和Bartlet检验均要求样本服从正态分布
Levene检验不依赖总体分布(首选)
3)相关性检验
检验方法:Pearson相关检验(正态数据)、Spearman相关检验和Kendall相关检验(秩检验)
psych包,corr.test()
Hmisc包,rcorr()