[基本功]卡方分布、卡方检验、卡方分箱

本文介绍了卡方分布的概念及其在假设检验中的应用,包括拟合优度检验和独立性检验,并详细阐述了卡方分箱的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、卡方分布

定义:k个独立的标准正态随机变量的平方和服从自由度为k的卡方分布

二、卡方检验:
χ k 2 = ∑ ( A − E ) 2 E , A 为 实 际 频 数 , E 为 期 望 频 数 \chi_k^2=\sum\frac{(A-E)^2}{E},A为实际频数,E为期望频数 χk2=E(AE)2AE

  • 拟合优度检验

    用来检验观测数与依照某种假设或分布模型计算得到的理论数之间一致性的假设检验。计算分类变量中各类别的期望频数与观察频数对比,判断是否有显著差异。

  • 独立性检验(列联分析)

    分析两个分类变量是否独立

三、卡方分箱

(1)初始化阶段:首先按照属性值大小排序,将每个属性值单独作为一组

(2)合并阶段:

  • 对每一对相邻的组,计算卡方值
  • 根据计算的卡方值,对其中最小的一对邻组合并为一组
  • 不断重复以上两步,直到计算出的卡方值都高于阈值,或分组达到一定数量
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值