前面,我们讲了logistic回归,单因素logistic回归分析。今天,我们来讲解一个数据分析的全过程,即所谓的单因素和多因素分析。
案例:
分析有生育障碍的妇女进行注射HCG后卵巢反应的影响因素,研究收集的参与者数据有高反应和正常反应共336名。按照传统的统计学分析方法,先单因素分析再多因素分析,此处涉及数据隐私,仅放部分数据。
[分析]
以卵巢反应为分组变量,分析的因素有:年龄、吸烟史、不孕类型、妊娠史、BMI、初潮年龄、平均月经周期、不孕持续时间、窦卵泡计数、黄体生成素、MC3雌二醇、MC3孕酮、MC3卵泡刺激素、卵巢反应其中吸烟史、不孕类型和妊娠史为分类资料,其他为连续型资料。
1 单因素分析
连续型资料按资料的分布采用t检验或秩和检验,分类资料按数据的类型有卡方检验、秩和检验和秩相关等,详见列联表详解。此研究数据均为无序分类资料,因此仅采用卡方检验或fisher检验即可。
1.1 对连续的数据进