SPSS—二元Logistic回归(转)

本文详细介绍了如何在SPSS中进行二元Logistic回归分析,包括似然比检验和Wald检验的步骤,以及如何处理因变量为二分类变量的回归分析。通过对"blankloan.sav"数据的实例分析,展示了随机抽样、模型建立、变量选择及模型评估的过程,探讨了模型的预测能力和准确性。
摘要由CSDN通过智能技术生成

二元Logistic,从字面上其实就可以理解大概是什么意思,Logistic中文意思为“逻辑”但是这里,并不是逻辑的意思,而是通过logit变换来命名的,二元一般指“两种可能性”就好比逻辑中的“是”或者“否”一样,

Logistic 回归模型的假设检验——常用的检验方法有似然比检验(likelihood ratio test) 和 Wald检验)
似然比检验的具体步骤如下:

1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0         

2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InL1

3:最后比较两个对数似然函数值的差异,若两个模型分别包含l个自变量和P个自变量,记似然比统计量G的计算公式为 G=2(InLP - InLl). 在零假设成立的条件下,当样本含量n较大时,G统计量近似服从自由度为 V = P-l 的 x平方分布,如果只是对一个回归系数(或一个自变量)进行检验,则 v=1.

wald 检验,用u检验或者X平方检验,推断各参数βj是否为0,其中u= bj / Sbj,  X的平方=(bj / Sbj),  Sbj 为回归系数的标准误

   这里的“二元”主要针对“因变量”所以跟“曲线估计”里面的Logistic曲线模型不一样,二元logistic回归是指因变量为二分类变量是的回归分析,对于这种回归模型,目标概率的取值会在(0-1),但是回归方程的因变量取值却落在实数集当中,这个是不能够接受的,所以,可以先将目标概率做Logit变换,这样它的取值区间变成了整个实数集,再做回归分析就不会有问题了,采用这种处理方法的回归分析,就是Logistic回归

设因变量为y, 其中“1” 代表事件发生, “0”代表事件未发生,影响y的 n个自变量分别为 x1,  x2 ,x3 xn等等

记事件发生的条件概率为 P

那么P=   事件未发生的概理为 1-P

 

事件发生跟”未发生的概率比 为( p / 1-p ) 事件发生比,记住Odds

将Odds做对数转换,即可得到Logistic回归模型的线性模型:

     还是以教程“blankloan.sav"数据为例,研究银行客户贷款是否违约(拖欠)的问题,数据如下所示:

 

上面的数据是大约700个申请贷款的客户,我们需要进行随机抽样,来进行二元Logistic回归分析,上图中的“0”表示没有拖欠贷款,“1”表示拖欠贷款,接下来,步骤如下:

   1:设置随机抽样的随机种子,如下图所示:

 

选择“设置起点”选择“固定值”即可,本人感觉200万的容量已经足够了,就采用的默认值,点击确定,返回原界面、

 2:进行“转换”—计算变量“生成一个变量(validate),进入如下界面:

 

在数字表达式中,输入公式:rv.bernoulli(0.7),这个表达式的意思为:返回概率为0.7的bernoulli分布随机值

如果在0.7的概率下能够成功,那么就为1,失败的话,就为"0"

  为了保持数据分析的有效性,对于样本中“违约”变量取缺失值的部分,validate变量也取缺失值,所以,需要设置一个“

  • 13
    点赞
  • 89
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值