关注本号后,回复软件名称,即可拿到软件下载链接哦!
分类资料在医学统计中很常见,有些统计学书上称为计数资料,比如(有效、无效),(发病、不发病),(男、女),血型(A、B、O、AB)等等。 分类资料一般根据频数整理成列联表的形式,一般的列联表多是二维的(也称行列表,或R×C列联表,高维列联表下次讨论),列联表根据变量是否有序可以分为双向无序、单项有序、双向有序列联表,统计方法是不同的,分析如下:
一、双向无序列联表
(一)成组四格表
是指行、列变量均为无序的列联表,例如要研究吸烟和肺癌之间的关系,行变量为是否吸烟:吸烟、不吸烟,列变量为肺癌发病:发病,不发病,如下表:
发生肺癌 | 未发生肺癌 | |
吸烟 | a | b |
不吸烟 | c | d |
对于这种数据,我们的统计目的是分析行列变量的独立性,即:肺癌发病是否与吸烟有关,可选用的方法有以下两种:
1、Pearson卡方检验:
基于卡方分布,H0为行、列变量相互独立,SPSS中“分析->描述性统计->交叉表”可实现。 四格表使用条件:专用公式①样本总数大于40;②各个单元格理论值均大于5。校正公式:①样本总数大于40;②理论值1①样本总数小于40,或T<1