中心极限定理

在毕业设计中要做一个异常值剔除的步骤。所以看了一篇paper,Detection of Outliers in Navigation Sensor Measurements文中有提到

For a Gaussian statistics, large residuals are exponentially rare, and outliers are not an issue. Unfortunately, the nature rarely follows Mr. Gauss; any hopes to salvage the situation by invoking the Central Limit Theorem are crushed by a Gaussian’s extremely slow convergence at the tails. In practice, “fat tails” are quite common and are at the root cause of solution errors due to outliers.

收到这一启发,希望去理解“中心极限定律”。于是便看到知乎的这篇文章:https://www.zhihu.com/question/22913867
群众的眼睛是雪亮的,第一个回答是最易于理解的

X1+X2+...+XnnEX1+nstd(X1)N(0,1)+op(nstd(X1))

它认为:
1、大数定律和中心极限定理可以看做随机变量的零阶和一阶“泰勒展开”其中大数定律是“随机变量”的零阶估计,中心极限定理是在大数定律成立的前提下的“一阶导数”。
2、大数定律负责给出估计——期望,中心极限定理负责给出大数定律估计的误差。
3、通过泰勒展开我们可以对中心极限定理的应用有一个直观的估计。为了使得泰勒展开成立,我们假设了高阶小量 op(nstd(X1)) 在取平均(除以 n 后)是可以忽略的。为了使得这一点成立,我们至少需要样本量和方差在同一个数量级或者更大。
4、其实我们还可以进行更高阶的展开,貌似三阶展开对应的统计量叫做skewness,wiki上常用分布的词条都会给出这一数值。不过实际应用中中心极限定理已经足够,所以通常不需要。

Ditian Deng的回答也很好,就是偏向理论。在理解它的回答的时候需要理解依概率收敛和依分布收敛以及概率空间等概念。
https://www.zhihu.com/question/26736727
https://www.zhihu.com/question/20642770/answer/33191096
然后,大数定律估计的误差的分布描述中的std(X1)可以通过猴子的答案中找到蛛丝马迹。即先通过样本来估计总体的标准差

s=(xμ)2n1

然后通过以下公式来计算标准误差
SE=sn

具体的应用可参考
https://www.zhihu.com/question/31593033/answer/102375277
中心极限定理的直观动画参考
http://onlinestatbook.com/stat_sim/sampling_dist/index.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值