bootstrap 模态框弹出就消失了_使用相关数据测试多模态

27ff083dc9719a66f496ae758d817a3c.png

摘要:

我们提出通过从适当构造的转换概率内核中进行重采样来对具有相关数据的多模态进行测试,其中包括 Silverman 的具有独立数据的测试作为特例。 我们将具有独立且均匀分布的数据的 Silverman 检验的一些理论特性扩展到弱相关的数据,并且相对于稳健性讨论了 Silverman 测试的独立性。

一些关键词:

高斯核;马尔可夫链 Silverman 测试;平滑的自回归引导程序;均匀遍历

I 简介

对动力系统的研究激发了我们对多模态的兴趣,动力系统可能具有多个平衡点。在随机环境中,它们可能以多峰概率分布的形式表现出来,反映了系统动力学对分布的混合以及平衡周围位置的影响。多模态对预测也具有重要意义。 例如,样本均值实际上可能是不良的长期预测!更一般的说,在随机动力系统中,固定密度下的模式数量提供了有关基础动力过程的局部操作模式数量的重要信息。

在独立数据的密度中进行多模态测试的问题已在文献中引起了广泛关注。在本说明中,我们针对具有均质跃迁概率核的平稳 p 阶马尔可夫过程的一维平稳边际密度中的模态数推广了 Silverman 的引导测试。注意,有限阶马尔可夫过程的类别相当广泛,包括所有有限阶 order 模型和非线性自回归模型。虽然可以使用样本部分自相关来凭经验检查诸如有限阶自回归模型之类的特定马尔科夫假设,但似乎缺乏针对一般马尔科夫假设的非参数检验,需要进一步研究。

在第 2 节中,我们介绍了适用于有限阶马尔可夫过程的平滑自回归引导程序。该方法包括(i)使用乘积高斯核平滑方案估计真实的过渡概率核,以及(ii)从估计的 Markov 过程生成引导序列。内核平滑方案的带宽设置为估计的边际密度允许假设的模式数量的最小带宽。 Silverman(1981)的结果确保了以 h 表示的这种临界带宽的存在。 Bootstrap 系列用于近似计算观察到的临界带宽的 p 值 pr(h≥h obs),该值在与零假设相符的最不理想假设下进行评估。我们表明,此处开发的自举测试相对于马尔可夫阶是鲁棒的。特别是,Silverman 的多模式引导测试在抵御独立性假设方面非常有力。我们在§3 中将这些理论特性中的一些扩展到了弱相关的数据。所有证据都收集在附录中。在第 4 节中,我们用一些模拟的和真实的数据说明了引导测试。最后,我们在第 5 节中作总结性发言

II 多模态测试

3df4f53e2252d0b8eedf52f1623ce40e.png
fb5d5f42ce49d1dc4efd5f1d03ecd7f7.png

III 一些理论性质

83c0c9ebc5d39c8613cd7c213690babb.png
9c781ce36ceb3bef43f365458add5dd0.png
ba866a3f7a292c7d55666a3756fa25ab.png
859c179cf8d6b49c59239046808e2881.png
a2f8a0ca103c8f57149d2de5ac611627.png
1a7305348c184dbb60e21b86b25233cb.png
363359667401eb8a7d9ed6d86fdf4bf8.png

因此,在假设 1-3 下,p 阶马尔可夫平稳条件下的一阶性质与独立数据假设下的一阶性质相同。 特别是,扩展的 Silverman 检验具有渐进性,并且渐进地具有原始 Silverman 检验的一些缺点,例如对异常值的敏感性和保守性(Hall&York,2001)。 但是,假设 1 要求底层的马尔可夫过程允许指数衰减的混合速率; 如果几乎违反了此假设,则测试不必过于保守。 的确,如下面的模拟研究所示,该测试对于几乎非平稳的过程可能变得宽松。 研究强烈依赖于模式测试程序属性的影响是一个有趣的未来问题。

IV 模拟与样例

efba9203d86248c485e26a90d4cff682.png

实验中使用了六个自回归参数值,即 w =±0·5,±0·9 和 ±0·95。在这里,真实的边际密度可以证明是单峰的。因此,我们仅考虑在将马尔可夫阶设置为 0 或 1 的情况下测试密度是否为单峰的情况。回想一下,对于零马尔可夫阶,数据被视为独立数据,并且该测试成为通常的 Silverman 测试。样本大小等于 100,并且基于 200 个引导程序计算引导程序 p 值;每个实验重复 200 次。表 1 列出了名义 5%试验的经验拒绝率。请注意,自回归系数的幅度越接近 1,则过程越接近非平稳性。该实验的结果表明,Silverman 检验及其在此处开发的推广具有相似的经验规模,并且通常是保守的。当流程几乎是不稳定的,从而几乎违反了假设 1 时,测试将变得自由。在基于平滑自回归引导程序的测试中,尺寸失真问题似乎没有在 Silverman 测试中那样严重,这是扩展 Silverman 测试的优点。但是,| w | = 0·95 的情况意味着底层过程在时间上有很强的依赖性。在 −0·9 到 0·9 的范围内,基于平滑自回归自举的新测试的经验大小与标称值 5%相当。因此,我们建议使用新测试来测试具有弱相关性的马尔可夫数据的多模态。我们还对固定的一阶,阈值自回归模型生成的数据进行了实验,在这种情况下,该测试似乎是保守的,对于检测多模态具有中等强度。

533c00ca35ece5620b1b0ea910f62b49.png

表 1 从一阶自回归模型生成的时间序列数据密度的单峰性的名义大小为 5%的试验的经验拒绝率

接下来,我们用 1969 年 11 月 24 日至 1997 年 11 月 28 日的每日恒生指数来说明该测试。这是一个相当长的时间序列,包含 6909 个香港证券交易所的每日收盘价。原始数据显示出指数增长模式。为了引起近似平稳,我们考虑对数转换后的恒生指数的第一个差异;关于时间序列图,请参见图 1,其中显示了三个可能的“异常值”,分别对应于 1987 年 10 月 26 日和 1989 年 6 月 5 日的两次最大的坠机,以及 1997 年 10 月 29 日的最大的反弹。变换后的恒生系列在如此长的时间范围内是静止的,该系列被分为五个时期以供进一步研究;参见表 2。我们采用了 Cheng-Tong(Cheng&Tong,1992)阶次确定方法,该方法选择的阶次最小化了第一步预测误差平方的非参数交叉验证和。根据这一标准,在整个时间范围内,对数恒生数据的第一个差异可能是一阶过程,零阶竞争非常激烈。该结论与以下观点是一致的,即如果香港股市充分有效,对数转换后的恒生指数应表现为随机波动。表 2 总结了在五个时间段内对数转换后的恒生指数差异密度的众数测试结果。有趣的是,该测试表明,在前三个时期内,转换后的恒生指数的密度是单峰的,但在最后两个时期内可能是三峰的。请注意,这三个“异常值”发生在最后两个期间。随后,我们从数据中删除了这些离群值,并重复了分析;参见表 3。如果没有第四阶段最大的车祸,则密度似乎也是单峰的。当最后阶段的最高反弹消失时,密度似乎也是单峰的。该示例对说明 Silverman 的测试和此处开发的扩展名对异常值敏感。

4b3f4191c8face2e5bd1e8ed7b04ffec.png

表 2 从 1969 年 11 月 24 日到 1997 年 11 月 28 日的 5 个周期中,对数转换后的恒生每日指数的第一个方差的多态性检验

3e62b8001e60282d33d24bd60aae4181.png

表 3 从 1969 年 11 月 24 日至 1997 年 11 月 28 日的 5 个期间内,对数转换后的恒生每日指数的第一个方差的多模态检验,并从数据中删除了三个异常值

因此,我们建议探索这些测试在检测异常值方面的潜力是值得的。

V 讨论

我们注意到假设 1 提出了一个相当强的假设,即指数衰减的混合速率。 这个假设排除了一些比几何混合速度慢的马尔可夫过程(Nummelin&Tuominen,1983; Tuominen&Tweedie,1994)。 令人感兴趣的是放松该混合速率并将该方法扩展到具有合适的混合速率的非马尔可夫过程。 密度模式的数量通常是通过检验假设序列来确定的。 这种方法需要进行校正以确保固定的总错误率。 探索顺序测试方法的替代方法很有趣。 另一个问题是评估订单确定对扩展的 Silverman 检验的影响

致谢

本文由南京大学软件学院 2020 级博士虞圣呈翻译转述。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值