卡方检验及其分箱方法

卡方检验是一种用途很广的基于卡方分布的假设检验方法,

根本思想就是比较理论频数和实际频数的吻合程度或拟合优度问题。

主要应用于分类变量,根据样本数据推断总体分布与期望分布是否有显著差异或推断两个分类变量是否相关或相互独立。

公式是利用类别变量的观测值频数与期望值频数进行构建的。

#方法一
crit = stats.chi2.ppf(q=0.95,df=5)  #95置信水平 df = 自由度
print(crit) #临界值,拒绝域的边界 当卡方值大于临界值,则原假设不成立,备择假设成立
P_value = 1-stats.chi2.cdf(x=chi_squared_stat,df=5)
print('P_value')
print(P_value) 
# 方法二 
stats.chisquare(f_obs=observed, #Array of obversed counts
                f_exp=expected) #Array of expected counts 

 

卡方分箱是依赖于卡方检验的分箱方法,在统计指标上选择卡方统计量(chi-Square)进行判别,

分箱的基本思想是判断相邻的两个区间是否有分布差异,基于卡方统计量的结果进行自下而上的合并,直到满足分箱的限制条件为止。

 

 

参考:

https://zhuanlan.zhihu.com/p/128905132

https://blog.csdn.net/weixin_36437103/article/details/112334482(理解自由度)

https://blog.csdn.net/weixin_42097808/article/details/80494939(卡方分箱解释实例)

https://blog.csdn.net/CarryLvan/article/details/108775507(分箱代码)

https://blog.csdn.net/resourse_sharing/article/details/51852331(卡方计算)

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值