作者|Satyam Kumar 编译|VK 来源|Towards Data Science
Q-Q图是检验任何随机变量(如正态分布、指数分布、对数正态分布等)分布的图形方法,是观察任何分布性质的一种统计方法。
例如,如果给定的一个分布需要验证它是否是正态分布,我们运行统计分析并将未知分布与已知正态分布进行比较。然后通过观察Q-Q图的结果,我们可以确定给定的分布是否正态分布。
绘制Q-Q图的步骤:
给定一个未知的随机变量。
找到每个百分位值
生成一个已知的随机分布,根据该分布同样遵循步骤1-2。
绘制Q-Q图
给定一个随机分布,需要验证它是否为正态/高斯分布。为了便于理解,我们将这个未知分布命名为X,将已知的正态分布命名为Y。
生成未知分布X:
X = np.random.normal(loc=50, scale=25, size=1000)
我们正在生成一个正态分布,有1000个值,平均值=50,标准差=25。
查找1%~100%:
X_100 = []
for i in range(1,101):
X_100.append(np.percentile(X,