统计学笔记-2

中心极限定理

中心极限定理有多种表现形式,35 中心极限定理中,所讲的是对一具有有限的均值 μ \mu μ和方差 σ 2 \sigma^2 σ2的遵从任意分布特性的随机变量X,则对于随机变量
Y = ∑ x i N Y=\frac{\sum x_i}{N} Y=Nxi

在N无限增大时, Y ∼ N ( μ , σ 2 N ) Y\sim N(\mu,\frac{\sigma^2}{N}) YN(μ,Nσ2)。这使得我们不必关注于X的具体分布,只要对X有足够的抽样样本,我们就可以得到一个已知分布的随机变量,并且建立起两者间的关系,从而通过正态分布的特殊性来解决未知分布的问题。

另外扩展的形式则更加放宽了条件,我们不必局限于一个随机变量,对一组相互独立的随机变量,分别具有有限的数学期望和方差,其和的分布同样遵从正态分布。这背后的含义是:如果一个量是由大量相互独立的随机因素影响所造成的,而每一个别因素在总影响中所起的作用不很大(大家都差不多,并无具有明显优势的变量),则这个量服从或近似服从正态分布。从而进一步扩大了中心极限定理的应用范围。

偏度(Skew)、峰度(Kurtosis)

高阶矩的另一种叫法。两者分别反应了分布的对称情况与分布的尖锐程度。

伯努利分布

伯努利分布可以看作 n = 1 n=1 n=1时的二项分布,这点从两者的符号表示即可以看出。随机变量 X ∼ B ( 1 , p ) X\sim B(1,p) XB(1,p),有:
E ( X ) = p E(X)=p E(X)=p

D ( x ) = p ( 1 − p ) D(x)=p(1-p) D(x)=p(1p)

样本均值的抽样分布

样本均值的抽样分布根据中心极限定理就是正态分布。

基于以上内容,就可用来解决一些实际的问题。对于视频中的例题,解题的思路就是:无论原分布是何种分布,其样本均值的抽样分布是正态分布,通过对问题的转化,将问题转换到抽样分布框架下,并通过样本的估计总体的统计量,从而得到抽样分布的均值和方差,进而解决问题。

而误差范围,就像是这种题逆向的思路,我们有了样本数据,并通过样本数据估计了总体均值和方差,但我想知道通过这些样本所得到的估计有多好,而样本均值的分布刚好满足正态分布,从而可以简单的解得 μ \mu μ或者 σ 2 \sigma^2 σ2的某种置信度的致信区间。

另一个应用范围就是给定置信度,来确定所需的样本范围。总体思想和上面差不多,只是每次的条件在变(给定置信区间、置信度),去寻找其他的条件(置信度、置信区间、样本数量)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值