16种常用的数据分析方法-列联分析

24 篇文章 2 订阅
21 篇文章 1 订阅

列联分析通常用来分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。

 

对关联性问题的处理称为独立性检验(Test of Independence),通过交叉列联表和c2检验进行列联分析。

 

交叉列联表分为二维表与三维表两种,二维表交叉表可进行卡方检验,三维交叉表,可作Mentel-Hanszel分层分析。

 

 

列联表结构

 

2*2 列联表

 

 

 

r*c 列联表

 

 

 

案例

 

公司在4个不同的地区设有分公司,公司准备进行工资级别调整。采用抽样调查方式,从4个分公司共抽取420个样本 (人),了解职工对此调整的看法,交叉统计结果如下:

 

 

 

观察频数分布表&百分比分布表的分布

 

列联交叉表中的统计值有两种类型:频数与百分比,对于两种类型的分布表,观察其分布时,要注意:

 

一、频数分布表

 

  1、观察边缘分布

 

行边缘分布:行观察值的合计数的分布

 

列边缘分布:列观察值的合计数的分布

 

2、观察条件分布与条件频数

 

变量 条件下变量 Y  的分布,或在变量 Y  条件下变量 X的分布

 

每个具体的观察值称为条件频数

 

 

 

二、百分比分布

 

为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布

 

1、观察行百分比:行的每一个观察频数除以相应的行合计数(fijri)

2、观察列百分比:列的每一个观察频数除以相应的列合计数( fijcj )

3、观察总百分比:每一个观察值除以观察值的总个数( fij)

 

 

 

交叉列联表分析步骤

 

1.【分析】—【描述统计】—【交叉表】

 

 

【精确】

一般情况下,"精确检验"(Exact Tests)对话框的选项都默认为系统默认值,不作调整。

 

 

【统计量】

 

 

【单元格】

 

 

 

【格式】

 

 

2.结果分析:

 

 

卡方检验

 

a. 16 单元格(100.0%) 的期望计数少于 5。最小期望计数为 .56。

 

原假设:H0:职称、学历两者相互独立。

皮尔逊(Pearson)的Chi-Square 值为18.553,自由度为9,

p=.029<0.05,拒绝原假设,即在5%的显著性水平下不同文化程度对职称的影响存在着显著差异。

 

结论:文化程度越高,职称越高。

  • 5
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
常用数据分析方法 常用数据分析方法全文共3页,当前为第1页。常用数据分析方法:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析; 问卷调查常用数据分析方法:描述性统计分析、探索性因素分析、Cronbach'a信度系数分析、结构方程模型分析(structural equations modeling) 。 数据分析常用的图表方法:柏拉图(排列图)、直方图(Histogram)、散点图(scatter diagram)、鱼骨图(Ishikawa)、FMEA、点图、柱状图、雷达图、趋势图。 数据分析统计工具:SPSS、minitab、JMP。 常用数据分析方法: 1、聚类分析(Cluster Analysis) 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。 2、因子分析(Factor Analysis) 因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。 因子分析方法约有10多,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性 2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。 3、相关分析(Correlation Analysis) 相关分析(correlation analysis),相关分析是研究现象之间是否存在某依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一非确定性的关系,例如,以X和Y分别记一个人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。 4、对应分析(Correspondence Analysis) 对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。 5、回归分析 研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。回归分析(regression analysis)是确定两或两以上变数间相互依赖的定量关系的一统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 6、方差分析(ANOVA/Analysis of Variance) 又称"变异数分析"或"F检验",是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 数据分析常用的图表方法有: 柏拉图(排列图) 排列图是分析和寻找 响质量主原因素的一工具,其形式用双直角坐标图,左边纵坐标表示频数(如件数金额等),右边纵坐标表示频率(如百分比表示)。分折线表示累积频率,横坐标表示影响质量的各项因素,按影响程度的大小(即出现频数多少)从左向右排列。通过对排列图的观察分析可抓住影响质量的主原因素。 直方图 将一个变量的不同等级的相对频数用矩形块标绘的图表(每一矩形的面积对应于频数)。 直方图(Histogram)又称柱状图、质量分布图。是一统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。 散点图(scatter diagram) 散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某关联或总结坐标点的分布模式。 鱼骨图(Ishikawa) 鱼骨图是一发现问题"根本原因"的方法,它也可以称之为"因果图"。其特点是简捷实用,深入直观。它看上去有些

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值