python 卡方检验_特征选择二:卡方检验法

      卡方检验可以用于判断两个类别变量的相关性是否显著。在分类的应用场景中可以用卡方检验选择特征,特征与目标变量的相关性越显著说明特征越重要,预测力越强。

      一、先简单介绍一下卡方检验的步骤。假设y为目标变量,取值为好和坏,x为特征变量取值为高、中、低。

      1、先计算y和x的实际值列联表,如下图:

0362b67b72d94bd854625e1fef575493.png

      2、假设y和x不相关,总体y中坏占比=254/1831=13.87%。根据原假设,计算出假设值列联表:

a993688ef4054d76b88285832cfeed22.png

      3、计算卡方统计量:

28564bcf161c93c9dcae7155d91045bd.png

      其中,A是实际值,T是假设值,卡方分布的自由度=(x属性个数-1)*(y属性个数-1)=(3-1)*(2-1)&#

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值