中心极限定理(Central Limit Theorem, CLT)是统计学中的一个重要定理,它描述了在一定条件下,大量相互独立的随机变量之和经过标准化后趋于正态分布的现象。这个定理对于统计推断和概率论有着极其重要的意义。
中心极限定理的一般表述如下:
独立同分布的随机变量:假设有一系列相互独立的随机变量𝑋1,𝑋2,...,𝑋𝑛X1,X2,...,Xn,它们具有相同的分布,期望值为𝜇μ,方差为𝜎2σ2。
标准化:将这些随机变量的和进行标准化处理,即计算它们的平均值𝑋‾X并减去它们的期望值𝜇μ,然后除以它们的标准差𝜎/𝑛σ/n:𝑍=𝑋‾−𝜇𝜎/𝑛Z=σ/nX−μ
趋近正态分布:随着样本量𝑛n的增加,标准化后的随机变量之和𝑍Z趋于正态分布,即使原始随机变量𝑋𝑖Xi的分布不是正态的。
中心极限定理的特别之处在于,它允许我们使用正态分布来近似描述许多不同类型的分布,只要样本量足够大。这使得正态分布在统计学中得到了广泛的应用,尤其是在样本均值的分布估计、置信区间的计算和假设检验等方面。
需要注意的是,中心极限定理的适用性取决于随机变量的独立性和同分布性,以及样本量的大小。在实际应用中,通常需要样本量足够大(例如,n>30)才能得到较好的正态近似。此外,对于某些特定的分布,如均匀分布或指数分布,即使样本量较小,中心极限定理也适用。