SPSS MODELER 二项Logistic回归-电信客户流失预测

一、Logistic回归

与多元线性回归不同,logistic回归可以用来解决分类问题,其中二项Logistic回归通常可以解决是否购买、是否流失等二分类问题,而多项Logistic回归可以用于多分类的操作。本篇先介绍二项的logistic回归

1.1为什么Logistic回归可以用来解决分类问题?

回顾多元线性回归问题的经验,可以发现多元线性回归的目标是数值型变量,假定为y,y的取值范围是全体实数,即

y = 𝛽1+𝜔2𝛽2+𝜔3𝛽3+⋯+𝛼

当目标函数是(二)分类变量时,y的取值是{0,1}这样一个集合,无法用权重和偏差来表示,即等号不成立,为了使y成为一条线性函数,需要经历以下变换:

①令u = p(y = 1)/ 1 - p(y = 1),此时u的取值范围是【0,+∞】————(p是指概率)

②对u取对数,令Y= ln u,此时Y的取值范围就是【-∞,+∞】,可以使等号成立了,这就是Logistic变换

1.2Logistic回归的统计检验

1、-2对数似然值(-2 log likelihood, -2LL) ————检验回归方程的显著性,取值范围【0,1】,数值越大方程越显著

2、回归系数的检验 —————————————Wald检验

3、回归方程拟合优度的检验 —————————Cox&Snellp R2统计量、Nagelkerkep R2统计量(修正的)、混淆矩阵

二、数据转化

2.1数据输入

此步骤用于读取数据

添加“类型”节点以定义字段,从而确保所有测量级别都已正确设置。例如,大多数值为 0 和 1 的字段都可以用作标志字段,但某些字段,比如性别,作为包含两个值的名义字段会更加准确

将流失字段 chum 级别设置为目标,其他所有字段设置为输入

2.2数据过滤

数据集一共有42个字段,此步骤用于排除一些无关变量,以便得到更优的结果

为“类型”节点添加“特征选择”模型,可以用来删除不能为目标函数添加任何有用信息的变量(无关变量)

进一步的,打开“特征选择”模型,选择“生成”,点击“过滤”,从而生成过滤节点,在对话框中,选择所有已标记的字段:重要,以上操作可以实现仅选择被认为很重要的数据来用作预测变量

2.3数据审核

此步骤检查数据是否具有异常值、缺失值

将“数据审核”节点添加到生成的过滤节点中,在“数据审核”浏览器的“质量”选项卡上,单击完成百分比列以便按数值升序顺序对此列进行排序。这样就可以识别所有含有大量缺失数据的字段;在本示例中,唯一需要修改的字段是 logtoll ,其完成值比例小于 50%

在缺失插补列中,单击指定 ,对于 插补条件 ,选择 空白值和空值 ,对于固定值,选择 平均值 ,选择 平均值 可确保插补值不会反过来影响总数据中所有值的平均值

在“数据审核”的“质量”选项卡上,生成缺失值超节点,在“缺失值超节点”对话框中,将样本大小增加到 50%,然后单击确定,超节点将显示在流画布中,其标题为:缺失值插补,将超节点附加到过滤节点

三、二项Logistic回归

在建模选项卡中添加logistic节点,在 Logistic 节点上,单击“模型”选项卡并选择二项过程。在 二项过程 区域,选择 向前步进 法

在“专家”选项卡上,选择专家模式,然后单击输出。此时显示“高级输出”对话框。在“高级输出”对话框中,选择在每个步骤作为显示类型。选择 迭代历史记录 和 参数估计 ,然后单击 确定

在 Logistic 节点上,单击运行创建模型,在结果模型中,点击 高级 选项卡,重点关注分类表(Classification Table)

向前步进法从空模型(即,没有预测变量的模型)开始,可以将此空模型用作与最终构建的模型进行比较的基础。按照惯例,此空模型会将所有值都预测为 0,因此其准确度为 72.6%,这完全是因为已正确预测到 726 个未流失的客户。但是,根本没有正确预测到已流失的客户

此分类表显示了在每个步骤中添加预测变量之后模型的结果。在第一个步骤中(在仅使用了一个预测变量之后),模型预测流失的准确性就已从 0.0% 增加到 29.9%

分类表显示步骤 8 为最后一步。在此阶段,算法已确定不再需要向模型添加任何其他预测变量。虽然预测非流失客户的准确性有所下降,达到了 91.2%,但预测已流失客户的准确性却从原来的 0% 上升到了 47.1%。这相比原来不使用任何预测变量的空模型其有效性显著提高

观察总体模型的统计检验中的 Nagelkerke R2列,发现随着预测模型的逐步加入,变量的显著性也逐渐提高(回归问题的R2偏低),因此模型拥有不错的解释力,对于希望减少流失的客户,能够将流失率减少接近一半将会成为保护其收入流的主要步骤

  • 53
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 多项Logistic回归是一种用于分析多个分类变量之间关系的统计方法,SPSS是一种常用的统计分析软件。如果要进行多项Logistic回归分析,可以按照以下步骤操作: 1. 打开SPSS软件并导入数据集。 2. 选择“分析”菜单下的“回归”选项,然后选择“多项Logistic回归”。 3. 将需要作为自变量的变量移动到“自变量”框中,将需要作为因变量的变量移动到“因变量”框中。 4. 可以选择对模型进行更改,例如添加交互项或者更改变量类型等。 5. 点击“确定”按钮运行分析,结果将会显示在输出窗口中。 需要注意的是,在进行多项Logistic回归分析前,需要确保所使用的数据符合模型的假设条件,并进行适当的数据清洗和变量选择。 ### 回答2: 多项Logistic回归是一种多变量Logistic回归分析,它是用于分析多个自变量对因变量的影响,即多分类或多项响应的统计方法。在SPSS进行多项Logistic回归分析,需要先准备好数据并且将因变量进行分类编码,例如将一个变量分为三种情况:低、中、高。同时,应选择合适的自变量,特别是那些与因变量相关且可能具有预测因变量能力的变量。 在进行多项Logistic回归分析前,需要先进行变量筛选,其中一种方法是采用单变量分析并计算出变量的相关系数,以此来选择与因变量最相关的自变量。另一种是采用逐步回归进行多变量分析,其中包括前向逐步选择、后向逐步删除和正向逐步选择等多种方法。 在进行多项Logistic回归分析时,还需考虑影响模型可靠性的因素。例如,通过检验模型的拟合优度和残差分析来确定模型的合理性,检查数据是否符合多项Logistic回归的假设,如是否满足线性性、独立性、多项式分布和同方差性等假设。 通过多项Logistic回归分析可以获得若干方面的信息,例如不同自变量对因变量的影响,因变量各类别的比较和分类预测。此外,模型还可以用于缺失值的填补、因变量异常值的检测和变量重要性的评估等方面。 总之,多项Logistic回归是一种重要的多变量分析方法,可用于响应变量的多类别预测和因素的分析。在SPSS中运用多项Logistic回归模型的过程中,需要考虑模型的选择和假设的检验,并根据分析结果制定相应的决策。 ### 回答3: 多项logistic回归是一种用于探究多个自变量与多分类因变量之间关系的统计分析方法,常常被应用于社会科学、教育、医学等领域。SPSS作为一款专业的数据分析软件,可以方便地进行多项logistic回归分析。 首先,进行多项logistic回归前需要确认变量类型,包括自变量和因变量。自变量可以是连续或分类数据,而因变量应是多个分类别。此外,需要对数据进行清洗和缺失值处理,以保证分析结果的可靠性。 之后,可以在SPSS进行多项logistic回归分析。在“Analyze”菜单下选择“Regression”-“Multinomial Logistic”即可进入分析界面。在该界面中,需设置因变量和自变量及建立模型的类型。可以通过“Method”选项指定模型的建立方法,包括“Enter”、“Stepwise”和“Forward”的方法。其中,“Enter”表示所有变量一次性进入模型建立,而“Stepwise”和“Forward”则是逐步筛选自变量进入模型。 在执行分析过程中,还需注意一些参数设置的重要性。其中,“Maximum Iterations”是对算法迭代次数的设定,过低的迭代次数可能导致结果不准确;“Criterion for Removal”和“Criterion for Entry”则是进行逐步回归时的剔除或加入标准。此外,应对结果进行统计检验和模型诊断,以验证模型的合理性。 最后,多项logistic回归分析的结果可以通过SPSS的输出窗口进行查看和解读。输出表格中包含了回归系数、标准误、z值、P值和95%置信区间等信息,其中p值可以用于判断变量是否显著影响因变量,在建立模型时也可以采用变量的AIC或BIC值进行模型选择。 综上所述,多项logistic回归是一种非常重要的多分类别数据分析工具,而SPSS作为专业的统计软件,提供了方便、快捷的分析路径和丰富的结果输出方式,帮助研究者快速、准确地探索变量之间的关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值