卡方检验python程序_卡方检验及其python实现

卡方检验是一种基于卡方分布的假设检验方法,用于比较理论频数和实际频数的吻合程度或判断分类变量间是否独立。本文介绍了卡方检验的基本概念、步骤、计算公式,并通过掷骰子和用户留存率分析两个实例展示了如何用Python进行卡方检验。
摘要由CSDN通过智能技术生成

什么是卡方检验

卡方检验是一种用途很广的基于卡方分布的假设检验方法,其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。其主要应用于分类变量,根据样本数据推断总体分布与期望分布是否有显著差异或推断两个分类变量是否相关或相互独立。

卡方检验分类

卡方检验步骤

卡方检验可以参照一般假设检验步骤:设置原假设与备择假设

设置显著性水平

根据问题选择具体的假设检验方式

计算统计量,并通过统计量获取P值

根据P值与显著性水平,决定接受原假设还是备择假设

一般可以设原假设为:观察频数与期望频数没有差异,或者两个变量相互独立不相关。

卡方检验的计算公式为:

从公式也可以看出它是利用类别变量的观测值频数与期望值频数进行构建的。

卡方检验的应用实例应用实例--拟合优度检验

以掷骰子为例,有一天小王同学闲来无事,发现桌上刚好有一枚骰子,身为数据分析师的他,好奇骰子是不是均匀的,于是他连着投掷了120次,并统计了各点出现的次数。由于原假设骰子是均衡的,所以每点数期望值都为20。

第一步我们确定原假设即骰子是均衡的,第二步设置显著性水平α=0.05,在确立使用卡方检验之后

确定上述统计值之后,并结合卡方表就可对其进行判断。

接下来用python实现

import pandas as pd

import numpy as np

from scipy import stats

#创建上述表

observed_pd = pd.DataFr

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值