SPSS:多项logistic回归分析

对流动人口留城意愿和多种影响因素的建立多元logistic回归模型

该全国流动人口动态监测调查的问卷中,设计有问题:“今后一段时间,您是否打算继续留在本地”(Q314),我们以此为流动人口流居其所在地意愿的依据,作为logistic回归的因变量(响应量)。

1.1 采用多元logit回归模型的原因:

该问题(Q314)的答案选项中,设计了“是”、“否”以及“没想好”三个离散的变量值,常规的二元logit回归,yi只有0和1两个取值,适用受限,因此采用多元logit回归进行分析。

1.2 自变量的选择:

1.2.1 对数据集中问题的选择和调整:

自变量包括的数值型变量:“过去一年,您家平均每月总收入”(Q105)、“出生年”(q101c1y),转换为分类变量后代入方程中,以避免使用截面数据做回归处理中产生异方差。

收入情况转化为“过去一年每月收入为0或亏损=1,过去一年每月收入不为0但低于4000=2,过去一年每月收入大于4000但小于10000=3”

出年年份转化为年龄(2017当年年龄)的分类变量,具体包括“年龄在40以下=1,年龄在40到60之间,不含60=2,年龄在60及以上=3”

自变量中包含的虚拟变量选择根据问题:“性别”(q101b1)(女性=2,男性=1)、“您现在的主要职业(Q205)”、“您是否参加*医保(包括Q504A1、Q504B1、Q504C1、Q504D1)”、“你有多长时间没有回老家(户籍地)(Q310)”、“首次您是和子女一起流动吗(Q305D)”

对数据集多元分类变量的问题转化为二元变量,包括对主要的职业分为二变量(无固定职业=1,有固定职业=2)。另外对参加医保的情况转为二变量(参加一种医保=1,没有参加或不清楚=2)。对婚姻状况转化为二变量(已婚=1,未婚=2),对受教育情况转换为二变量(完成高中及以上=1,未受任何教育或未完成高中教育=2)

处理好的变量视图:

7b82992491904f7cb82df00d18609d85.png

处理后的数据视图:

73868f55b1dc4320bf1aafeede1c1c20.png

1.3 进行多元Logistic回归:

1.【分析】【回归】【多项logistic】,打开主面板—— 因变量、自变量分别按照箭头指示移入对应的变量框内:

a5b217b852804b74bb99800d75d9ab28.png

点击【参考类别】按钮,默认勾选【最后一个类别】。(指以因变量和自变量的最后一个分类水平为参照,用其他分类依次与之对比,考察不同水平间的倾向。)

edc2070afc1743e2a101c837c85e80ff.png

2.主面板中,点击【模型】,打开【多项logistic回归:模型】对话框,勾选【主效应】。本例主要考察自变量年龄、性别、婚姻状况的主效应,暂不考察它们之间的交互作用,然后点击【继续】。

fed9d323736743f6bed5ee624b8fc9d7.png

3.主面板中,点击【统计】按钮,设置模型的统计量。主要【伪R方】【模型拟合信息】【分类表】【拟合优度】这几项必选,其他可以默认不勾选。这些参数主要用于说明建模的质量。

2d8f0d906b5b4053ad7cddff5b183817.png

4.主面板中,点击【保存】按钮,勾选【估算响应概率】,我们要求SPSS软件帮我们估算每个个案三类早餐的概率。下主面板底部点击【确定】按钮,软件开始执行此处建模。

f2dbea8ad95547689212703b5a48868e.png

5.其余的参数主要和逐步回归有关系,本例采用主效应模型,人为指定进入模型的自变量,在其他研究中,可以根据情况选择逐步回归。

1.4 结果解读:

1、个案处理摘要:       

列出因变量和自变量的分类水平及对应的个案百分比。建议在此表主要读取变量分类水平的顺序,比如自变量参与医保的情况,第一类是“至少参与一种医保”,第二类是“无参与医保或不清楚”。尤其是看清楚最后一个分类,因为前面参数设置时要求是以最后一个分类(因变量(留城意愿)中的“没想好”)做为对比参照组的

52293e9844ef4b3d8410803bc6de64a2.png

2、模型拟合信息和拟合优度:

读取最后一列,显著性值小于 0.05,说明模型有统计意义,模型通过检验。

原假设模型不能很好地拟合原始数据,拟合优度最后一列皮尔逊卡方显著性值小于 0.000,概率很小,拒绝原假设,说明模型对原始数据的拟合通过检验,,模型在统计学上有意义。

 2ae03f0d67d9403bbc0feca675af0ef1.png

07535648e85f4880a510aa8e598d70ab.png

3、似然比检验: 

模型似然比检验表,我们能看到最终进入模型的效应包括截距、性别、参与医保情况、主要职业、婚姻状况、受教育程度以及没回老家的时长,而且最后一列显著性值表明,9个自变量(影响因素)对模型构成除去性别(p=0.111)以及主要职业(p=0.180),其他均有显著贡献,研究它们是有意义的。

0659c0c4f7fa4363996e95b34b0a85f0.png

4、多元logistic回归模型参数估计:

dc93ae80ab874bc2964edced050f4ae9.png

列出自变量不同分类水平对停留该居住地的影响检验,是多项logistic回归非常重要的结果。

第二列 B 值,即各自变量不同分类水平在模型中的系数,正负符号表明它们与因变量是正比还是反比关系。第5列是瓦尔德检验显著性值,对应的第7列显著性值小于 0.05 说明对应自变量的系数具有统计意义,对因变量不同分类水平的变化有显著影响。

对结果进行分析,查看Exp(B)值和其置信区间,即第8列,该项意义类似于OR值:

比如,意愿留在该地和不确定是否留在该地相比,已婚的人群更偏向于选择在留在该地,这种可能性是未婚人群的 1.306 倍,95%的置信区间是(1.224,1.3993)。有参与医保相对更偏向于留在该地是没医保或不确定人群的1.235倍,95%的置信区间是(1.155,1.321)。

1.5.构建多项 logistic回归模型

G1=LOG[P(有意愿留在该地)/P(不清楚)]=1.290+0.0334(性别=1)+0.0000706(首次您是和子女一起流动的=1)+0.211(参与医保情况=1)-0.236(您多长时间没有回过老家(老家指户籍地家里)=1)-0.100(主要职业=1)+0.266(婚姻情况=1)+0.353(受教育程度=1)-0.430(过去一年平均每月收入=1)-0.245(过去一年平均每月收入=2)+0.0186(年龄2017=1)-0.077(年龄2017=2)

G2=G1=LOG[P(没有意愿留在该地)/P(不清楚)]=-1.220-0.0463(性别=1)-0.384(首次您是和子女一起流动的=1)+0.0815(参与医保情况=1)+0.0175(您多长时间没有回过老家(老家指户籍地家里)=1)-0.175(主要职业=1)-0.103(婚姻情况=1)+0.088(受教育程度=1)+0.607(过去一年平均每月收入=1)+0.080(过去一年平均每月收入=2)-0.743(年龄2017=1)-0.388(年龄2017=2)

G3=0 (对照组)

依据以上的式子,计算如下的概率值:

P1=exp(G1)/[exp(G1)+exp(G2)+exp(G3)]  #指留在本地的可能性

P2=exp(G2)/[exp(G1)+exp(G2)+exp(G3)] #指不打算留在本地的可能性

P3=exp(G3)/[exp(G1)+exp(G2)+exp(G3)] #还没想好的可能性

SPSS会自动进行模型概率预测:

0fe7f6a2185b44e8a83675ae734ca602.png

对预测结果和真实结果绘制列联表,模型正确百分比=80.1%,说明模型能较好预测流动人口今后一段时间是否继续停留本地的情况。

9c1cefdb61804e95a6e7a955731f6992.png

  • 28
    点赞
  • 102
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 多项Logistic回归是一种用于分析多个分类变量之间关系的统计方法,SPSS是一种常用的统计分析软件。如果要进行多项Logistic回归分析,可以按照以下步骤操作: 1. 打开SPSS软件并导入数据集。 2. 选择“分析”菜单下的“回归”选项,然后选择“多项Logistic回归”。 3. 将需要作为自变量的变量移动到“自变量”框中,将需要作为因变量的变量移动到“因变量”框中。 4. 可以选择对模型进行更改,例如添加交互项或者更改变量类型等。 5. 点击“确定”按钮运行分析,结果将会显示在输出窗口中。 需要注意的是,在进行多项Logistic回归分析前,需要确保所使用的数据符合模型的假设条件,并进行适当的数据清洗和变量选择。 ### 回答2: 多项Logistic回归是一种多变量Logistic回归分析,它是用于分析多个自变量对因变量的影响,即多分类或多项响应的统计方法。在SPSS中进行多项Logistic回归分析,需要先准备好数据并且将因变量进行分类编码,例如将一个变量分为三种情况:低、中、高。同时,应选择合适的自变量,特别是那些与因变量相关且可能具有预测因变量能力的变量。 在进行多项Logistic回归分析前,需要先进行变量筛选,其中一种方法是采用单变量分析并计算出变量的相关系数,以此来选择与因变量最相关的自变量。另一种是采用逐步回归法进行多变量分析,其中包括前向逐步选择、后向逐步删除和正向逐步选择等多种方法。 在进行多项Logistic回归分析时,还需考虑影响模型可靠性的因素。例如,通过检验模型的拟合优度和残差分析来确定模型的合理性,检查数据是否符合多项Logistic回归的假设,如是否满足线性性、独立性、多项式分布和同方差性等假设。 通过多项Logistic回归分析可以获得若干方面的信息,例如不同自变量对因变量的影响,因变量各类别的比较和分类预测。此外,模型还可以用于缺失值的填补、因变量异常值的检测和变量重要性的评估等方面。 总之,多项Logistic回归是一种重要的多变量分析方法,可用于响应变量的多类别预测和因素分析。在SPSS中运用多项Logistic回归模型的过程中,需要考虑模型的选择和假设的检验,并根据分析结果制定相应的决策。 ### 回答3: 多项logistic回归是一种用于探究多个自变量与多分类因变量之间关系的统计分析方法,常常被应用于社会科学、教育、医学等领域。SPSS作为一款专业的数据分析软件,可以方便地进行多项logistic回归分析。 首先,进行多项logistic回归前需要确认变量类型,包括自变量和因变量。自变量可以是连续或分类数据,而因变量应是多个分类别。此外,需要对数据进行清洗和缺失值处理,以保证分析结果的可靠性。 之后,可以在SPSS中进行多项logistic回归分析。在“Analyze”菜单下选择“Regression”-“Multinomial Logistic”即可进入分析界面。在该界面中,需设置因变量和自变量及建立模型的类型。可以通过“Method”选项指定模型的建立方法,包括“Enter”、“Stepwise”和“Forward”的方法。其中,“Enter”表示所有变量一次性进入模型建立,而“Stepwise”和“Forward”则是逐步筛选自变量进入模型。 在执行分析过程中,还需注意一些参数设置的重要性。其中,“Maximum Iterations”是对算法迭代次数的设定,过低的迭代次数可能导致结果不准确;“Criterion for Removal”和“Criterion for Entry”则是进行逐步回归时的剔除或加入标准。此外,应对结果进行统计检验和模型诊断,以验证模型的合理性。 最后,多项logistic回归分析的结果可以通过SPSS的输出窗口进行查看和解读。输出表格中包含了回归系数、标准误、z值、P值和95%置信区间等信息,其中p值可以用于判断变量是否显著影响因变量,在建立模型时也可以采用变量的AIC或BIC值进行模型选择。 综上所述,多项logistic回归是一种非常重要的多分类别数据分析工具,而SPSS作为专业的统计软件,提供了方便、快捷的分析路径和丰富的结果输出方式,帮助研究者快速、准确地探索变量之间的关系。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黄思博呀

真的有人打赏啊,超级感谢!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值