多项logistic回归系数解释_【SPSS】Logistic回归——消费者点击广告的行为预测

本文介绍了如何使用SPSS进行多项Logistic回归分析,以预测消费者点击广告的行为。通过导入数据并设置变量类型,然后进行二元Logistic回归操作,解释了分类协变量和哑变量的概念。结果显示预测准确率高达97.2%,并生成ROC曲线,AUC为0.992,表明预测效果良好。
摘要由CSDN通过智能技术生成

2f6cac1cce7c03603923643dd1023a28.png

在上篇文章中素言素语Sue:【R语言】Logistic回归——消费者点击广告的行为预测,我们使用R实现逻辑回归的案例,这篇作为姊妹篇,对同一案例使用SPSS工具来实现。

首先将数据导入SPSS,注意将Male和Click on Ad设置为名义变量,其他为度量变量。数据信息如下表所示:

855a49c922b7f14e6a525dbba017fa8a.png

回归过程

SPSS操作过程:

  • 选择“分析”——“回归”——“二元Logistic回归”,将Clicked on Ad放入因变量,将自变量放入协变量;
  • 对协变量进行分类,点击右上角“分类“,将Male放入分类协变量,对比选择默认的“指示符”,参考类别默认为“最后一个”。

ff9ae7030dd68ff6f3cb35fe63e85170.png

84774a58f288123225b8a4d421ff87bc.png

注意这里需要解释一下分类协变量,就要提到哑变量的概念。

当自变量为二分类或连续变量的时候,结果都很好解释;当自变量为多分类的时,比如race 1=白人,2=黑人,3=其他民族,并不意味着因变量随此顺序线性变化,若强行编码那就强行规定为等距变量了。因此,需要转化为哑变量.

每个哑变量只代表某两个级别或若干个级别间的差异。n个水平的自变量X,默认会产生n-1个哑变量,SPSS是以第n水平为参照水平。两个哑变量参数估计值反应了与参照水平的差异,估计值之差反应了其代表的变量的差异。

可选择多种分类对比方法:(参照水平组一般样本数不少于30到50例)

  • 默认“指示符对比”,参照水平为第一个或最后一个;
  • 有序分类变量可采用”差异对比“某水平与之前的所有水平进行比较,如果在某水平处系数变小且无统计学意义,说明到此影响达到停滞状态;
  • Helmert对比与上一个相反,是某水平与其后面各水平相比。
  • 重复对比:参照水平为”前一水平“
  • 多项式对比:仅适用于数值型分类变量,H0假设各水平是等距的,它们和LogitP(Logit变换后的P)的关系可能是n次方,模型依次用一个哑变量代表一个次方项,给出各检验结果。
  • 离差对比:每个水平和总体水平相比较,且此n个水平的回归系数的代数和为0

在保存里面,我们勾选预测值“概率”,因为在SPSS中,ROC不能直接生成,需要根据预测值进一步计算。最后点击确定就可以获得分析结果了。

54631242f68ee291fd8613581450b4e6.png

结果解读

结果中最主要的是这两张表,从分类表中,可以看出预测的准确率为97.2%(以0.5分界点);

从变量表中可以看出,除了Male之外,其余自变量系数都显著(sig<0)。关于系数的解释我们在上一篇R语言Logistic回归案例中已经说过了,这里不再赘述。

fe27a2ebd04a02f7fffb01d4f8f71c6c.png

计算ROC

SPSS操作:在“分析”-选择“ROC曲线图”,将上一步回归生成的预测变量放入检验变量,将Clicked on Ad放入状态变量,输出全部勾选。

生成一个带对角参考线的ROC曲线,曲线下的面积即AUC=0.992。说明预测性较好。

f0374da7764ab1666553060ad341fd89.png

e4ff99a6b55a8f3c06abdf79440245f9.png

同时也可以输出曲线上的坐标点,可以根据左边点选择最佳概率分界点。一般认为,使(敏感度+特异性-1)的值最大的分界点,就是最佳概率分界点。

deb4f8e69b4040d144c937a1e9b534b3.png

(此图较长,仅截图部分)

PS:第一时间获取数据分析学习最新文章,欢迎关注同名公众号:素言素语Sue

【SPSS】Logistic回归——消费者点击广告的行为预测​mp.weixin.qq.com
  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我会尽力回答你的问题。关于多元有序logistic回归分析,这是一种常见的统计分析方法,用于研究一个有序分类变量和一组自变量之间的关系。SPSS是一种常用的统计分析软件,可以进行多元有序logistic回归分析。 下面给出一个简单的实例教程,供参考: 假设我们想研究一个人的教育程度(有序分类变量,例如小学、初中、高中、大学)和他们的年龄、性别、职业等自变量之间的关系。我们可以使用SPSS进行多元有序logistic回归分析。 1. 准备数据 首先,我们需要准备数据。我们可以使用样本数据,或者自己进行数据收集。数据应该包含有序分类变量(教育程度)和一组自变量(例如年龄、性别、职业等)。 2. 打开SPSS并导入数据 打开SPSS软件,选择File -> Open -> Data,选择数据文件并导入数据。 3. 进行多元有序logistic回归分析 选择Analyze -> Regression -> Ordinal Regression,进入多元有序logistic回归分析界面。将有序分类变量(例如教育程度)拖入Dependent Variable框中,将自变量(例如年龄、性别、职业等)拖入Covariates框中。点击Model按钮,选择Enter,将所有自变量都加入模型。 4. 分析结果 分析结果将包括回归系数、标准误、z值、p值等。我们可以根据p值来判断自变量是否显著影响有序分类变量。此外,我们还可以使用SPSS的图表工具来可视化回归结果,帮助我们更好地理解分析结果。 以上就是一个简单的多元有序logistic回归分析的实例教程。希望能对你有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值