python卡方分箱_Python评分卡建模—卡方分箱

本文介绍了卡方分箱和卡方检验的概念及其在Python中的应用。通过实例展示了卡方检验如何用于判断两种疗法的疗效差异,以及ChiMerge分箱算法的步骤,包括初始化阶段和自底向上的合并阶段,强调了在合并阶段正确计算卡方值的重要性。
摘要由CSDN通过智能技术生成

为服从自由度为k的卡方分布,记作:

9f2ba9ba3756f86552dde8e5273f8f0f.png

或者记作

29547da6e039a9195e55c3f5a5f19be1.png

二、卡方检验

1dc337e0a5931ce79e3bbe59862c2aae.png

χ2检验是以χ2分布为基础的一种假设检验方法,主要用于分类变量之间的独立性检验。

其基本思想是根据样本数据推断总体的分布与期望分布是否有显著性差异,或者推断两个分类变量是否相关或者独立。

一般可以设原假设为 :观察频数与期望频数没有差异,或者两个变量相互独立不相关。

实际应用中,我们先假设原假设成立,计算出卡方的值,卡方表示观察值与理论值间的偏离程度。

卡方值的计算公式为:

其中A为实际频数,E为期望频数。卡方值用于衡量实际值与理论值的差异程度,这也是卡方检验的核心思想。

卡方值包含了以下两个信息:

1.实际值与理论值偏差的绝对大小

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值