0. 标准正态分布表与常用值
-
Z-score 是非标准正态分布标准化后的 x即 z = x − μ σ z = \frac{x-\mu}{\sigma}z=σx−μ
-
表头的横向表示小数点后第二位,表头的纵向则为整数部分以及小数点后第一位;两者联合作为完整的 x,坐标轴的横轴
-
表中的值为图中红色区域的面积,也即 cdf,连续分布的累积概率函数,记为 Φ ( x ) \Phi(x)Φ(x)
-
cdf 的逆,记为 Φ − 1 ( x ) \Phi^{-1}(x)Φ−1(x),如 Φ − 1 ( 3 / 4 ) \Phi^{-1}(3/4)Φ−1(3/4),表示 x 取何值时,阴影部分的面积为 0.75,查表可知,x 介于 0.67 和 0.68 之间;
>> from scipy.stats import norm >> norm.ppf(3/4) 0.6744897501960817
1. cdf 与 ppf(分位函数)
from scipy.stats import norm
覆盖的概率范围:
>> norm.cdf(1) - norm.cdf(-1)
0.6826894921370859
>> norm.cdf(2) - norm.cdf(-2)
0.9544997361036416
>> norm.cdf(3) - norm.cdf(-3)
0.9973002039367398
Φ ( x ) \Phi(x)Φ(x) 为 累积概率密度函数,也即 cdf:
>> from scipy.stats import norm
>> norm.cdf(0)
0.5
Φ − 1 ( x ) \Phi^{-1}(x)Φ−1(x),通过 norm(x) 进行计算:
>> from scipy.stats import norm
# Q3 分位点;
>> norm.ppf(3/4)
0.6744897501960817
# Q1 分位点
>> norm.ppf(1/4)
-0.6744897501960817