率分布。它以德国数学家和天文学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)的名字命名,他在研究天体运动时首次使用了这种分布。
正态分布的概率密度函数(PDF)具有以下形式:
𝑓(𝑥∣𝜇,𝜎2)=12𝜋𝜎2𝑒−(𝑥−𝜇)22𝜎2f(x∣μ,σ2)=2πσ21e−2σ2(x−μ)2
其中:
𝑥x 是变量。
𝜇μ 是分布的均值(期望值),表示分布的中心位置。
𝜎σ 是分布的标准差,表示数据分布的离散程度。
𝜎2σ2 是方差,是标准差的平方。
正态分布具有以下特点:
它是对称的,关于均值 𝜇μ 对称。
其均值 𝜇μ、中位数和众数是相等的。
大部分数据(约68%)位于 𝜇±𝜎μ±σ 范围内,几乎所有数据(约95%)位于 𝜇±2𝜎μ±2σ 范围内,这被称为68-95-99.7(经验)规则或正态分布的“三西格玛”规则。
正态分布的图形是一个钟形曲线,随着 𝑥x 远离 𝜇μ,概率密度逐渐减小。
正态分布在统计学中非常重要,因为它是许多统计方法的基础,如假设检验、回归分析和抽样分布。此外,中心极限定理指出,在一定条件下,大量独立随机变量之和趋向于正态分布,无论这些变量本身是否服从正态分布。这使得正态分布在实际应用中非常广泛,尤其是在处理大量数据时。