高斯分布,也称为正态分布(Normal Distribution),是概率统计学中最为重要的一种分布。高斯分布的概率密度函数(Probability Density Function,PDF)为:
f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=σ2π1e−2σ2(x−μ)2
其中, μ \mu μ 是分布的均值, σ \sigma σ 是标准差。高斯分布的图形呈钟形,中心对称,左右两侧曲线的形状相同,均值 μ \mu μ 为对称轴。标准差 σ \sigma σ 越大,曲线越矮胖,越矮胖的曲线越宽;标准差越小,曲线越高瘦,越高瘦的曲线越窄。
高斯分布具有以下特性:
- 68-95-99.7规则:在高斯分布中,大约 68% 的数据点落在均值的一个标准差范围内,大约 95% 的数据点落在均值的两个标准差范围内,大约 99.7% 的数据点落在均值的三个标准差范围内。
- 中心极限定理:多个独立的随机变量的均值的分布,随着随机变量数量的增加,趋向于高斯分布。这个定理在概率统计学中有广泛的应用。
- 高斯分布在自然界中的广泛存在:许多自然现象都服从高斯分布,例如人的身高、IQ 分数、体重等,因此高斯分布被广泛应用于实际问题的建模和分析中。
高斯分布是概率统计学中的一个基本概念,它在统计推断、机器学习、数据科学等领域中有着广泛的应用。