16种常用的数据分析方法-列联分析

25 篇文章 2 订阅
21 篇文章 1 订阅

列联分析通常用来分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。

 

对关联性问题的处理称为独立性检验(Test of Independence),通过交叉列联表和c2检验进行列联分析。

 

交叉列联表分为二维表与三维表两种,二维表交叉表可进行卡方检验,三维交叉表,可作Mentel-Hanszel分层分析。

 

 

列联表结构

 

2*2 列联表

 

 

 

r*c 列联表

 

 

 

案例

 

公司在4个不同的地区设有分公司,公司准备进行工资级别调整。采用抽样调查方式,从4个分公司共抽取420个样本 (人),了解职工对此调整的看法,交叉统计结果如下:

 

 

 

观察频数分布表&百分比分布表的分布

 

列联交叉表中的统计值有两种类型:频数与百分比,对于两种类型的分布表,观察其分布时,要注意:

 

一、频数分布表

 

  1、观察边缘分布

 

行边缘分布:行观察值的合计数的分布

 

列边缘分布:列观察值的合计数的分布

 

2、观察条件分布与条件频数

 

变量 条件下变量 Y  的分布,或在变量 Y  条件下变量 X的分布

 

每个具体的观察值称为条件频数

 

 

 

二、百分比分布

 

为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布

 

1、观察行百分比:行的每一个观察频数除以相应的行合计数(fijri)

2、观察列百分比:列的每一个观察频数除以相应的列合计数( fijcj )

3、观察总百分比:每一个观察值除以观察值的总个数( fij)

 

 

 

交叉列联表分析步骤

 

1.【分析】—【描述统计】—【交叉表】

 

 

【精确】

一般情况下,"精确检验"(Exact Tests)对话框的选项都默认为系统默认值,不作调整。

 

 

【统计量】

 

 

【单元格】

 

 

 

【格式】

 

 

2.结果分析:

 

 

卡方检验

 

a. 16 单元格(100.0%) 的期望计数少于 5。最小期望计数为 .56。

 

原假设:H0:职称、学历两者相互独立。

皮尔逊(Pearson)的Chi-Square 值为18.553,自由度为9,

p=.029<0.05,拒绝原假设,即在5%的显著性水平下不同文化程度对职称的影响存在着显著差异。

 

结论:文化程度越高,职称越高。

  • 5
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值