列联表(频数表)

频数表是将数据集按照某个特定分类(分组)时观察每个类/组中数据出现次数的表;列联表也是频数表,只不过它会分析的是将数据集按两个或两个以上类别变量联合分组时观察数据在每个分组中出现频数的表,所以又称交叉分类表。

简介

特殊地,如果我们使用样本数据的两个属性构建列联表,而且每个属性只有两个等级,那么我们会得到两行两列的的列联表,又称2 × 2四格表。例如对随机抽取的1000个人按照性别(男/女)及色觉(正常/色盲)两个属性分组来构建列联表。一般地,如果我们使用数据集的两个属性AB来构建列联表,其中A有r个等级A1, A2, …. Ar,B有c个等级B1, B2, …Bc,那么我们最终会得到一个r行c列的列联表,简称r × c,nij为等级Ai和Bj处的频数。更一般地,如果我们使用多个属性构建列联表时,我们会得到多维列联表。

作用

列联表分析的基本问题是:观察各属性之间是否独立?如在前面的例子中,性别与色盲是否有关系?在r × c中,若以pi,pj,pij表示数据集中数据属于Ai等级的频数,属于Bj的频数及同时属于AiBj的频数(pi,pj属于边际概率,pij属于格概率),那么“A、B两属性无关”这个假设成立的可表述为H0pij = pi*pj

 

如果变量的无关假设被拒绝了,那么我们需要某种度量来刻画变量间的相关程度,例如对于r × c,可用列联系数来度量关联的程度。

转载于:https://www.cnblogs.com/wangyubo/p/4450730.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值