中心极限定理
中心极限定理有多种表现形式,35 中心极限定理中,所讲的是对一具有有限的均值
μ
\mu
μ和方差
σ
2
\sigma^2
σ2的遵从任意分布特性的随机变量X,则对于随机变量
Y
=
∑
x
i
N
Y=\frac{\sum x_i}{N}
Y=N∑xi
在N无限增大时, Y ∼ N ( μ , σ 2 N ) Y\sim N(\mu,\frac{\sigma^2}{N}) Y∼N(μ,Nσ2)。这使得我们不必关注于X的具体分布,只要对X有足够的抽样样本,我们就可以得到一个已知分布的随机变量,并且建立起两者间的关系,从而通过正态分布的特殊性来解决未知分布的问题。
另外扩展的形式则更加放宽了条件,我们不必局限于一个随机变量,对一组相互独立的随机变量,分别具有有限的数学期望和方差,其和的分布同样遵从正态分布。这背后的含义是:如果一个量是由大量相互独立的随机因素影响所造成的,而每一个别因素在总影响中所起的作用不很大(大家都差不多,并无具有明显优势的变量),则这个量服从或近似服从正态分布。从而进一步扩大了中心极限定理的应用范围。
偏度(Skew)、峰度(Kurtosis)
高阶矩的另一种叫法。两者分别反应了分布的对称情况与分布的尖锐程度。
伯努利分布
伯努利分布可以看作
n
=
1
n=1
n=1时的二项分布,这点从两者的符号表示即可以看出。随机变量
X
∼
B
(
1
,
p
)
X\sim B(1,p)
X∼B(1,p),有:
E
(
X
)
=
p
E(X)=p
E(X)=p
D ( x ) = p ( 1 − p ) D(x)=p(1-p) D(x)=p(1−p)
样本均值的抽样分布
样本均值的抽样分布根据中心极限定理就是正态分布。
基于以上内容,就可用来解决一些实际的问题。对于视频中的例题,解题的思路就是:无论原分布是何种分布,其样本均值的抽样分布是正态分布,通过对问题的转化,将问题转换到抽样分布框架下,并通过样本的估计总体的统计量,从而得到抽样分布的均值和方差,进而解决问题。
而误差范围,就像是这种题逆向的思路,我们有了样本数据,并通过样本数据估计了总体均值和方差,但我想知道通过这些样本所得到的估计有多好,而样本均值的分布刚好满足正态分布,从而可以简单的解得 μ \mu μ或者 σ 2 \sigma^2 σ2的某种置信度的致信区间。
另一个应用范围就是给定置信度,来确定所需的样本范围。总体思想和上面差不多,只是每次的条件在变(给定置信区间、置信度),去寻找其他的条件(置信度、置信区间、样本数量)。