概率图(Q-Q图,Quantile-Quantile Plot)是用于检查一个数据集是否近似服从某一理论分布的一种可视化工具。在Q-Q图中,理论分位数(Quantiles)与观测到的分位数进行比较。如果数据集与理论分布拟合得很好,那么点将近似分布在一条对角线上。
下面是一个使用Python和Matplotlib绘制Q-Q图的示例,以检查数据是否服从正态分布:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
import seaborn as sns
# 生成随机数据,模拟正态分布
np.random.seed(0)
data = np.random.normal(0, 1, 1000) # 均值为0,标准差为1
# 绘制Q-Q图
stats.probplot(data, dist="norm", plot=plt)
plt.title("Q-Q Plot for Normal Distribution")
plt.show()
这段代码的关键部分是 stats.probplot(data, dist="norm", plot=plt)
,它会绘制数据 data
的Q-Q图,其中参数 dist="norm"
表示比较的理论分布为正态分布。如果数据符合正态分布,Q-Q图中的点将近似分布在一条对角线上。
您可以将这个示例代码应用于您的数据,以检查数据是否接近于正态分布或其他理论分布。如果数据点在对角线附近分布得较好,那么数据更可能符合所选择的理论分布。