卡方分布和卡方验证的关系理解,以及Python实现

本文介绍了卡方分布的概念,通过Python代码展示了正态分布平方和如何逼近卡方分布。接着讨论了卡方检验的原理和应用,并通过实例解释了Python中进行卡方检验的方法,包括卡方拟合性检验和卡方独立性检验。文章还探讨了Pearson卡方检验为何符合卡方分布,并提供了相关资源。
摘要由CSDN通过智能技术生成

卡方分布

定义:设 X1…Xn是服从标准正态分布的随机变量,则称统计量
在这里插入图片描述

服从自由度为n的卡方分布,自由度为n时,他的期望是n,方差为2n
他是标准正态分布变量的平方和,网上找了一张概率密度图:
在这里插入图片描述
然后我很好奇的是,这张图怎么画出来的呢?
既然是正态分布的平方和,我就试一下弄几个正态分布平方和,看看图形是不是这个样子。
用Python代码

# 产生服从N(0,1)分布的1000个数
x1 = np.random.randn(1000)
y1 = np.power(x1,2)

一个一个产生太慢了,,用循环生产随机数:

# 给定一个正数n,产生n个正太分布的平方和
def product(n):
    n = np.ceil(n).astype(int)
    if n <=0:return None
    y = np.power(np.random.randn(1000),2)
    for i in range(1,n):
        y += np.power(np.random.randn(1000),2)
    return y

画什么图?对于正态分布图,数据都会集中在一个点附近,所以我们用直方图最容易看出数据的分布情况

plt.figure(figsize=(10,10))
for i in range(9):
    plt.subplot(3,3,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.hist(product
  • 3
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
验证Python中组数量的分布是否均匀,可以使用统计学中的假设检验方法。以下是一种可能的方法: 1. 收集数据:首先,需要获取一个包含不同组数量的数据集。可以通过访问已知的Python代码库或平台上的存储库,例如GitHub或PyPI,来获取Python项目的源代码。收集足够数量的项目,并记录每个项目中的组数量。 2. 定义假设:对于这个问题,我们可以将假设定义为:“在Python项目中,组数量的分布是均匀的。” 3. 计算期望:假设组数量是均匀分布的,我们可以计算在该假设下每个组数量的期望频率。例如,如果总共有100个项目,每个项目可以有1到10个组,那么每个组数量的期望频率为10%。 4. 计算观察频率:根据收集到的数据,计算每个组数量的实际观察频率。例如,如果在100个项目中有20个项目有1个组,30个项目有2个组,那么观察频率为:1组频率为20%,2组频率为30%。 5. 应用假设检验:可以使用卡方检验(chi-square test)来比较期望频率和观察频率。卡方检验将计算一个统计量(卡方值),该值与自由度相关。可以根据给定自由度的显著性水平,查找对应的临界值。如果计算得到的卡方值超过了临界值,则可以拒绝原假设(组数量的分布是均匀的),反之则不能拒绝原假设。 6. 解释结果:根据是否拒绝了原假设,可以得出结论。如果拒绝了原假设,则说明Python项目中的组数量分布不均匀。如果不能拒绝原假设,则说明Python项目中的组数量分布可能是均匀的。 需要注意的是,在收集数据和进行统计分析时,需确保样本的代表性和数据采集的方法的准确性,以获得可靠的结果。实际分析中还可以采用其他的统计方法来验证组数量的均匀分布,如Kolmogorov-Smirnov检验、Anderson-Darling检验等。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值