第三章 采样方法
现实中很多问题求解会很困难,就会需要计算机模拟,从一个概率分布中生成观察值的方法,就叫采样,就算在已知观察值的基础上随机生成观察值也存在一些困哪。书中说到了一些采样方法,之后可以尝试了解。
3.1 蒙特卡洛法求定积分;
3.1.1 无意识统计学家法则LOTUS
3.1.2 投点法
3.1.3 期望法
3.2 蒙特卡洛采样
3.2.1 逆采样
3.2.2 博克斯-穆勒变换
3.2.3 拒绝采样与自适应拒绝采样
3.3 矩阵的极限与马尔科夫链
3.4 查普曼-柯尔莫哥洛夫等式
3.5 马尔科夫链蒙特卡洛
3.5.1 重要性采样
3.5.2 马尔科夫链蒙特卡洛的基本概念
3.5.3 Metropolis-Hastings算法
3.5.4 Gibbs采样
第四章 非参数检验方法
不依赖某种特定理论的统计方法,或是在不了解总体分布及其全部参数的情况下的统计方法。总体分布不要求正态分布或分布不明时,用来检验数据是否来自同一个总体的检验方法就是非参数检验方法。
4.1 列联分析
列联表是由两个以上的变量进行交叉分类的频数分布表,皮尔逊的卡方检验在1899年提出,被用于检验实际分布与理论分布适配程度,卡方检验主要用于对两个定类变量之间关系的分析,即考查观测频数与期望频数之间的吻合程度。R中用chisq.test()进行卡方检验,对卡方检验求期望频率a.by.a.test$expected,如果部分期望频率过小(<5),那么得到的p值可能不可靠,那么需要模拟采样得到更加精确的p值,chisq.test(data.matrix,simulate.p.value = TRUE) 表示用蒙特卡洛模拟的方法计算p值,另一种方法是对期望频数较小的变量进行合并。
如果列联表中观测值太小的部分占多数,那么可以用费希尔的“确切检验”(Fisher’s exact test) R中用fisher.test()函数检验。
4.2 符号检验
符号检验的核心思想是分析数据中正负号出现的频率,并确定他们是否有显著的差异。符号检验不像参数检验那么灵敏,当数据量较大时,两者会有相对吻合的结果(binom.test())。符号检验不会出现将极端值舍去的情况,因为它只使用数据方向的信息而忽略数值的大小,所以得到的p值可能更加极端,威尔克森符号秩检验可以弥补这一不足,其考虑了数据的方向和大小信息(威尔科克森符号秩检验:wilcox.test(…,paired=TRUE);可以用于两独立样本的威尔科克森秩和检验:wilcox.test(…,paired=FALSE)。
4.5 克鲁斯卡尔-沃利斯检验
秩和检验可以检验来自不同总体的样本是否具有相同的分布,而K-W检验可以检验来自大于两个的独立总体的样本是否有相同分布,也称为“H检验”(Kruskal.test())。