正态分布
我们来对某一个年级做一项调查,看一看这个年级到底有多巨。于是,他们统计了每个同学一周刷题的时间。得到的结果如下:
可以看出,大多数人每周都有7-8个小时做题,有少部分蒟蒻(比如我)每周只有1-3个小时做题,而一些神犇(比如这位)每周有13-15个小时刷题。
整个图表大致上是轴对称的。中间最多,两边最少。这种分布图称为正态分布。
正态分布又称为高斯分布,他是由高斯发现的。正态分布也是最常见的概率分布。对于上面那个例子,我们统计足够多的人、将时间区间分的足够小之后,就可以画出他的概率密度曲线:
概率密度曲线一定满足 ∫ − ∞ + ∞ f ( x ) = 1 \int_{-\infty}^{+\infty}f(x)=1 ∫−∞+∞f(x)=1正态分布也不例外。
其实上面的例子并不是真正的正态分布,因为不存在负时间。但是,真正的正态分布的概率密度曲线可以向负无穷和正无穷无限延伸。图像以 x x x轴为渐近线,也就是:
lim x → ∞ f ( x ) = 0 \lim\limits_{x\rightarrow\infty}f(x)=0 x→∞limf(x)=0
我们的高斯给出了正态分布的数学表达式:
f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f(x)=\dfrac1{\sqrt{2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}} f(x)=2πσ1e−2σ