-
正态分布的pdf f(y):
-
正态分布的形状特点:
- 单峰unimodal,对称symmetric
-
正态分布有两个参数:
- 均值mean:
- 方差variance:
-
68-95-99.7%法则:
- 68%的概率在的范围内发生事件
- 95%的概率在的范围内发生事件
- 99.7%的概率在的范围内发生事件
-
Z score
- Z score测量一个样本点距离总体均值的距离,通常会表达为该样本点位于均值以上(下)几个方差。
- 均值的Z score是0。
- 当样本点的Z score的绝对值大于2时(即落在这个范围的外面),该样本点是反常的。
- 任何形状的分布都可以使用Z score,不单单限制于正态分布
- Z score测量一个样本点距离总体均值的距离,通常会表达为该样本点位于均值以上(下)几个方差。
-
Percentiles
- 在正态分布的情况下,可以使用Z score计算percentiles,即落在某个Z score之后的样本点的比例。从图像上来看,percentile是曲线下方被Z score画竖线分割后朝左的面积。有的教材也把percentile成为Z的cumulative probability F(Z)。
- 计算Percentiles的两种方式:
- 查询Z table:
- 找到我们需要的Z score(本例子中为-1.00),即可找到对应的percentile为0.1587
- 使用R语言:
-
pnorm(-1, mean = 0, sd = 1)
-
- 查询Z table:
参考:
1. Duke Coursera
2. Mathematical Statistics with Application