看书标记【统计学习理论与方法】3、4

最新推荐文章于 2024-04-28 21:02:29 发布

小胡涂记

最新推荐文章于 2024-04-28 21:02:29 发布

阅读量136

点赞数

分类专栏：统计学文章标签： r语言数据分析

本文链接：https://blog.csdn.net/qq_41599676/article/details/130319166

版权

统计学专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章介绍了计算机模拟在解决复杂问题中的应用，特别是采样方法，如蒙特卡洛法、逆采样和马尔科夫链蒙特卡洛。此外，还讨论了非参数检验，包括列联分析中的卡方检验、符号检验及其在R语言中的实现，以及克鲁斯卡尔-沃利斯检验在比较多个独立总体分布中的作用。

摘要由CSDN通过智能技术生成

第三章采样方法

现实中很多问题求解会很困难，就会需要计算机模拟，从一个概率分布中生成观察值的方法，就叫采样，就算在已知观察值的基础上随机生成观察值也存在一些困哪。书中说到了一些采样方法，之后可以尝试了解。
3.1 蒙特卡洛法求定积分；
3.1.1 无意识统计学家法则LOTUS
3.1.2 投点法
3.1.3 期望法
3.2 蒙特卡洛采样
3.2.1 逆采样
3.2.2 博克斯-穆勒变换
3.2.3 拒绝采样与自适应拒绝采样
3.3 矩阵的极限与马尔科夫链
3.4 查普曼-柯尔莫哥洛夫等式
3.5 马尔科夫链蒙特卡洛
3.5.1 重要性采样
3.5.2 马尔科夫链蒙特卡洛的基本概念
3.5.3 Metropolis-Hastings算法
3.5.4 Gibbs采样

第四章非参数检验方法

不依赖某种特定理论的统计方法，或是在不了解总体分布及其全部参数的情况下的统计方法。总体分布不要求正态分布或分布不明时，用来检验数据是否来自同一个总体的检验方法就是非参数检验方法。

4.1 列联分析

列联表是由两个以上的变量进行交叉分类的频数分布表，皮尔逊的卡方检验在1899年提出，被用于检验实际分布与理论分布适配程度，卡方检验主要用于对两个定类变量之间关系的分析，即考查观测频数与期望频数之间的吻合程度。R中用chisq.test()进行卡方检验，对卡方检验求期望频率a.by.a.test$expected，如果部分期望频率过小（<5），那么得到的p值可能不可靠，那么需要模拟采样得到更加精确的p值，chisq.test(data.matrix,simulate.p.value = TRUE) 表示用蒙特卡洛模拟的方法计算p值，另一种方法是对期望频数较小的变量进行合并。
如果列联表中观测值太小的部分占多数，那么可以用费希尔的“确切检验”（Fisher’s exact test） R中用fisher.test()函数检验。

4.2 符号检验

符号检验的核心思想是分析数据中正负号出现的频率，并确定他们是否有显著的差异。符号检验不像参数检验那么灵敏，当数据量较大时，两者会有相对吻合的结果(binom.test())。符号检验不会出现将极端值舍去的情况，因为它只使用数据方向的信息而忽略数值的大小，所以得到的p值可能更加极端，威尔克森符号秩检验可以弥补这一不足，其考虑了数据的方向和大小信息（威尔科克森符号秩检验：wilcox.test(…,paired=TRUE)；可以用于两独立样本的威尔科克森秩和检验：wilcox.test(…,paired=FALSE）。