卡方分布:
n个观测值 来自一个符合正态分布的总体,正态总体的均值是,方差是
则有:
自由度
其中是样本的方差;
推论性质:
当和相互独立 则也符合卡方分布,且自由度为;可以推算n个卡方分布同理。
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
x = np.linspace(0, 100, 100000) # 在0和100之间返回均匀间隔的数据,数据量为100000
color = ["blue", "green", "darkgrey", "darkblue", "orange"]
for i in range(10, 51, 10):
y = stats.chi2.pdf(x, df=i)
plt.plot(x, y, c=color[int((i - 10) / 10)])
plt.title("卡方分布图")
plt.tight_layout()
plt.show()
随着自由度的增加,卡方分布的概率密度曲线趋于对称。当自由度n -> +∞的时候,卡方分布的极限分布就是正态分布。
from scipy import stats
# 卡方分布
stats.chi2
#分布函数值
stats.chi2.cdf(α,自由度);
# 概率密度函数
stats.chi2.pdf(α,自由度);
# 右分位点,若取95%置信系数,则α=(1-0.95)/2
stats.chi2.isf(α,自由度);