1、引入
在医学统计中,计数资料是非常常见的,比如(患病、未患病),(男、女),(有效、无效)等等,这类资料通常会被整理成列联表的形式,我们平常接触到的列联表多数都是二维的(R×C列联表)。根据变量是否有序,又分为单向有序、双向有序属性相同、双向有序属性不同列联表,不同的列联表所用统计方法是不一样的。在后续定性资料统计推断中我们会一一介绍其操作步骤,这节先通过一个例子看一下简单的2×2列联表的卡方检验(反映理论频数和实际频数的差异大小)过程。
2、问题与数据
为了探讨吸烟与慢性支气管炎有无关系,调查了339人,结果如下:
![db9e396fc318969643682e402d7529be.png](https://i-blog.csdnimg.cn/blog_migrate/3b728c6bdba07d49dffa307729812d19.jpeg)
3、操作步骤
3.1 数据录入
![9d7f95cd2c23cbce209ac3b9929d2e9d.png](https://i-blog.csdnimg.cn/blog_migrate/d0de5593eadcde206f52b4e2373808c4.jpeg)
注意数据的录入方式,给不同变量的不同分类定义新的标签值,这里,变量x代表是否吸烟:0代表吸烟,1代表不吸烟;变量y代表是否患病:0代表患病,1代表不患病。
3.2 数据加权
因为数据是汇总格式,所以需要先对数据进行加权。
![16bdc579b532b97b819e72b5828f15ce.png](https://i-blog.csdnimg.cn/blog_migrate/41d088d41e10aa109e9aa94e2854709d.jpeg)
弹出个案加权对话框后,选择个案加权系数,激活频率变量,将人数放入频率变量栏中,点击确定。
![0c990eb9c112910756d48cf27cbaf402.png](https://i-blog.csdnimg.cn/blog_migrate/b8d874a1243972ba030d039f662c8457.jpeg)
3.3 卡方检验和Fisher精确检验
![1add4dc529712327ed7f66293c0df998.png](https://i-blog.csdnimg.cn/blog_migrate/43edc72375ba1dd604303c599c317445.jpeg)
将是否吸烟选入行,是否患慢性支气管炎选入列(结局变量放入列)
![85884cfa7206ffbf240a10d3d12725d9.png](https://i-blog.csdnimg.cn/blog_migrate/7106017a2f811f8e5a7cd2eef30f0dd5.jpeg)
点击精确,弹出的对话框中选择卡方
![bedf14d75f21fb2e421d11042f307bc3.png](https://i-blog.csdnimg.cn/blog_migrate/328dc205ad051fefb09d6dfb0320b6fd.jpeg)
点击格式,计数框中选择实测和期望,百分比框中选择列。
![989167504f9ec00024bb3547f0dfb274.png](https://i-blog.csdnimg.cn/blog_migrate/3f29e316a05ea9c5daa2597801a92799.jpeg)
4、结果解读
4.1个案处理摘要
![3c6465fbac3bb88b377d05746e3274d5.png](https://i-blog.csdnimg.cn/blog_migrate/6acc92fc2dc37b73713218f706ae2bea.jpeg)
表中可以看出有效个案数、缺失个案数和总计个案数。
4.2交叉表
![69a782e2a6a9a794aebbe387546c45b5.png](https://i-blog.csdnimg.cn/blog_migrate/c9b4ab45a5dba5a42546282e6088b172.jpeg)
由于使用卡方检验要求每个单元格频数不少于5,当条件不满足时,应当用Fisher精确检验。由表格可以看出期望计数的最小值为22.14,大于5,所以可以直接采用卡方检验。
4.3卡方检验
![09d676a7e4a12b9c712d45edac53fccd.png](https://i-blog.csdnimg.cn/blog_migrate/0768710826769fc0f266895fe6bbb5ad.jpeg)
由结果得χ2=7.469,P=0.006<0.05,所以应该拒绝原假设,认为患慢性支气管炎与吸烟之间不是相互独立的。研究问题时,当任何一个期望计数小于5时,便不再使用卡方检验,而是采用Fisher精确检验,由表格可以看出,本题的费希尔精确检验的双侧P值为0.007。
今天的内容就到这里,你学会了吗?有任何疑问可以到微信公众号留言,看到后我们会及时回复哦~#清风计划#
![98e69d8356d5c05c80818a9bf0a9ff95.gif](https://i-blog.csdnimg.cn/blog_migrate/badd764b37b8c2084038ae36d1589755.gif)