python卡方检验计算pvalue值_Python数据科学:卡方检验

本文介绍了Python中的卡方检验,用于分析两个分类变量间的关系。通过卡方检验,可以判断是否破产与是否违约是否相关。文中展示了如何使用Python的scipy库进行卡方检验,并解释了卡方统计量和P值的概念,最终得出这两个分类变量无关的结论。
摘要由CSDN通过智能技术生成

951a5646f3ee14ef8ab1ed60817485b2.gif

之前已经介绍的变量分析:

①相关分析:一个连续变量与一个连续变量间的关系。

②双样本t检验:一个二分分类变量与一个连续变量间的关系。

③方差分析:一个多分类分类变量与一个连续变量间的关系。

本次介绍:

卡方检验:一个二分分类变量或多分类分类变量与一个二分分类变量间的关系。

如果其中一个变量的分布随着另一个变量的水平不同而发生变化时,那么两个分类变量就有关系。

卡方检验并不能展现出两个分类变量相关性的强弱,只能展现两个分类变量是否有关。

/ 01 / 数据挖掘的技术与方法

数据挖掘的方法分为描述性与预测性两种。

两类方法均是基于历史数据进行分析。

描述性模型用于直观反映历史状况,为后续分析提供灵感。

预测性模型从历史数据中寻找规律,并用于预测未来。

描述性数据挖掘常用算法:聚类分析、关联规则分析。

预测性数据挖掘常用算法:线性回归、逻辑(Logistic)回归、神经元网络、决策树、支持向量机。

/ 02 / 卡方检验

01 列联表

列联表是一种分类汇总表。

将待分析的两分类变量中的一个变量的每一个类别设为列变量。

另一个变量的每一个类别设为行变量,中间对应着不同类别下的频数。

下面以书中的数据为例,即探索分类变量是否违约与分类变量是否破产的关系。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值