中心极限定理

注:本文转自中心极限定理通俗理解

一,什么是中心极限定理

中心极限定理是统计学中比较重要的一个定理。本文将通过模拟数据的形式,形象地展示中心极限定理是什么,是如何发挥作用的。

中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取n个抽样,一次抽m次。然后把这m组抽检分别求出均值。这些均值的分布接近正态分布

我们举个栗子
现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。然后,我们求出第一组的体重的平均值,第二组的平均值,一直到最后一组的体重的平均值。中心极限定理说,这些平均值是呈现正态分布的。并且,随着组数的增加。效果会越好。最后我们再把1000组算出来的平均值取个平均数,这个平均值就会接近全国平均体重

其中要注意几点:
1,总体本身的分布不要求正态分布。
上面的栗子中,人的体重是正态分布的,但是如果我们的例子是掷一个筛子(平均分布),最后每组的平均值也会组成一个正态分布。

2,样本每组要足够大,但也不需要太大
取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。

用实际数据来展示中心极限定理

第一步,生成数据
假设我们现在在观测一个人掷筛子。这个筛子是公平的,也就是说掷出1~6的概率都是相同的:1/6.它掷了一万次。我们用R模拟投掷的结果。

#随机的生成10000个1:6的数字
#设定随机种子数(以便每次随机出现的结果都是一样的)
set.seed(1234)
data = sample(1:6,10000,replace = TRUE)
#打印平均值
mean(data)
#打印标准差
sd(data)

生成的平均值为3.5026
生成的标准差为1.7012
生成的平均值接近3.5很好理解。因为每次掷出的结果是1,2,3,4,5,6.每个结果的概率都是1/6.所以加权平均值为3.5

第二步画出分布图
我们把生成的数据用直方图画出来直观的感受一下

#画出数据的直方图
hist(data,col="blue",breaks = c(0.5,1.5,2.5,3.5,4.5,5.5,6.5),main="频率分布表")
text(x=1:6,y=table(data),labels = table(data),pos=3)

在这里插入图片描述
可以看到1~6分布都比较平均,整体分布呈现平均分布

第三步,抽一组抽检来试一试

> #抽一组数据来看看情况
> p = sample(data,10)
> p
 [1] 6 6 4 2 6 5 4 5 6 6
> mean(p)
[1] 5
> sd(p)
[1] 1.333333

这10个数字结果为6.6.4.2.6.5.4.5.6.6,均值为5,标准差为1.3333
可以看到我们只抽10个的时候,样本的平均值为5距离总体平均值3.5有所偏差

第四部见证奇迹的时刻
我们让中心极限定理发挥作用,现在我们抽取1000组,每组50个
我们把每组的平均值都算出来

> #我们让中心极限定理发挥作用,现在我们抽取1000组,每组50个
> #我们把每组的平均值都算出来
> m = NULL
> for (i in 1:1000) {
+   m[i]=mean(sample(data,50))
+   
+ }
> mean(m)
[1] 3.5071
> sd(m)
[1] 0.2390547
> hist(m,col = "lightblue",main = "均值直方图"

在这里插入图片描述
此时均值为3.5071,标准差为0.2390547
此时可以看到每组抽样的平均值得分布是属于正态分布的,而且不论原来的数据属于什么分布(本次栗子中的总体数据属于平均分布而不是正态分布)
同时我们每组要足够大,但是也不需要太大,一般情况下每组大于等于30个的时候,即可让中心极限定理发挥作用。
还用刚才的栗子,刚才我们每组数据为50个现在我们使每组的数据为2个3个10个等看下均值分布效果。
在这里插入图片描述
从图中可以看出每组抽样数量越多图形越接近正态分布,当抽样数为30时已经算比较接近了,同时每组抽样数越多标准差越小。

实际应用

在实际生活中,我们不能知道我们想要研究对象的平均值,标准差之类的统计参数。中心极限定理在理论上保证了我们可以只抽一部分就可以计算出近似的平均值。考虑、、

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值