看书标记【统计学习理论与方法】3、4

文章介绍了计算机模拟在解决复杂问题中的应用,特别是采样方法,如蒙特卡洛法、逆采样和马尔科夫链蒙特卡洛。此外,还讨论了非参数检验,包括列联分析中的卡方检验、符号检验及其在R语言中的实现,以及克鲁斯卡尔-沃利斯检验在比较多个独立总体分布中的作用。
摘要由CSDN通过智能技术生成

第三章 采样方法

现实中很多问题求解会很困难,就会需要计算机模拟,从一个概率分布中生成观察值的方法,就叫采样,就算在已知观察值的基础上随机生成观察值也存在一些困哪。书中说到了一些采样方法,之后可以尝试了解。
3.1 蒙特卡洛法求定积分;
3.1.1 无意识统计学家法则LOTUS
3.1.2 投点法
3.1.3 期望法
3.2 蒙特卡洛采样
3.2.1 逆采样
3.2.2 博克斯-穆勒变换
3.2.3 拒绝采样与自适应拒绝采样
3.3 矩阵的极限与马尔科夫链
3.4 查普曼-柯尔莫哥洛夫等式
3.5 马尔科夫链蒙特卡洛
3.5.1 重要性采样
3.5.2 马尔科夫链蒙特卡洛的基本概念
3.5.3 Metropolis-Hastings算法
3.5.4 Gibbs采样

第四章 非参数检验方法

不依赖某种特定理论的统计方法,或是在不了解总体分布及其全部参数的情况下的统计方法。总体分布不要求正态分布或分布不明时,用来检验数据是否来自同一个总体的检验方法就是非参数检验方法。

4.1 列联分析

列联表是由两个以上的变量进行交叉分类的频数分布表,皮尔逊的卡方检验在1899年提出,被用于检验实际分布与理论分布适配程度,卡方检验主要用于对两个定类变量之间关系的分析,即考查观测频数与期望频数之间的吻合程度。R中用chisq.test()进行卡方检验,对卡方检验求期望频率a.by.a.test$expected,如果部分期望频率过小(<5),那么得到的p值可能不可靠,那么需要模拟采样得到更加精确的p值,chisq.test(data.matrix,simulate.p.value = TRUE) 表示用蒙特卡洛模拟的方法计算p值,另一种方法是对期望频数较小的变量进行合并。
如果列联表中观测值太小的部分占多数,那么可以用费希尔的“确切检验”(Fisher’s exact test) R中用fisher.test()函数检验。

4.2 符号检验

符号检验的核心思想是分析数据中正负号出现的频率,并确定他们是否有显著的差异。符号检验不像参数检验那么灵敏,当数据量较大时,两者会有相对吻合的结果(binom.test())。符号检验不会出现将极端值舍去的情况,因为它只使用数据方向的信息而忽略数值的大小,所以得到的p值可能更加极端,威尔克森符号秩检验可以弥补这一不足,其考虑了数据的方向和大小信息(威尔科克森符号秩检验:wilcox.test(…,paired=TRUE);可以用于两独立样本的威尔科克森秩和检验:wilcox.test(…,paired=FALSE)。

4.5 克鲁斯卡尔-沃利斯检验

秩和检验可以检验来自不同总体的样本是否具有相同的分布,而K-W检验可以检验来自大于两个的独立总体的样本是否有相同分布,也称为“H检验”(Kruskal.test())。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值