列联表是医学科研中最常见的数据存储格式(或者说数据类型)之一。
通常,列联表的横纵方向展示的是两个不同的分类变量,最常见的类型就是四格表(即2×2的列联表)。如下图所示,横向变量是“是否患肺癌”,纵向变量是“是否吸烟”,都是二分类变量,表格中的数据展示的则是每个分类变量水平组合下的人数(频数)。这是最简单的列联表数据,大家也最熟悉。当然,现实世界中,列联表的数据格式可不止这一种,下面我们一一熟悉一下,顺便了解一下如何对数据进行统计学检验。1拟合优度检验拟合优度检验针对的是样本数据的分布,即样本数据与已知总体的分布是否相同。
现欲研究男性群体中,所有血型所占比例是否相同。由卡方检验的结果可知,四种血型分布在男性中并不均匀。
如果事先知道四种血型在男性群体中的分布,要检验该样本是否符合该分布呢?这里的参数p定义的就是已知总体的频率分布。2卡方齐性检验和卡方独立性检验卡方齐性检验是用来比较不同分组下,各个类型的比例是否一致,即男女群体中,血型分布是否一样。