判别分析、logistic在信用风险评估中的应用

利用判别分析、logistic模型来分析信用风险的文章很多,这类文章应该传入国内最早的方法之一了。但是看期刊文章可以发现,作者都喜欢直接给出结果,至于如何得到结果的过程通常并不是非常的明晰。《Application of Proc Discrim and Proc Logistic in Credit Risk Modeling》一文给出SAS软件的具体操作:

1.判别分析

之前转载过一篇判别分析的例子:http://blog.csdn.net/yugao1986/article/details/6359080

这里大体类似:

/*该例是预测开户两年的账户的信用等级情况*/
/*案例数据build,目标变量分为3类等级A、C、O,自变量有3个
credit_limit number_of_trades utilization*/
DATA build;
   INPUT credit_limit number_of_trades utilization Target $ @@;
   DATALINES;
1300 22 0.41 O 400 9 0.88 C 2500 29 0.57 O 4400 49 0.29 A
4900 43 0.86 A 5200 49 0.36 A 2500 35 1.02 A 600 9 0.83 C
1100 28 0.88 O 600 11 0.50 C 500 33 0.12 C 1600 26 0.90 O
4000 49 0.43 A 400 11 1.09 C 2400 36 0.22 O 2500 29 0.76 O
5400 53 0.30 A 2700 32 0.68 O 500 8 1.09 C 2000 36 0.54 O
1600 35 0.54 O 500 8 1.10 C 650 13 1.00 C 5000 46 0.71 O
5100 52 0.17 A 2200 37 0.60 O 1400 25 0.50 O 2200 31 0.37 O
4700 49 0.75 A 1500 33 0.25 O 1600 29 0.63 O 2200 33 0.25 O
1500 30 0.27 O 1600 38 0.58 O 1800 39 0.45 O 2100 37 0.37 O
1700 36 0.68 O 2100 28 1.00 O 1600 29 0.65 O 600 10 0.50 C
1300 25 0.22 O 1900 24 0.18 O 1900 33 0.49 O 2600 30 0.53 O
2300 24 0.12 O 1200 34 0.30 O 5400 52 0.47 A 2600 35 0.33 O
1700 24 0.65 O 500 8 0.73 C 600 7 0.40 C 4400 47 0.10 A
2200 31 0.50 O 1400 34 0.64 O 5100 47 0.71 A 2000 31 0.17 O
2300 30 0.30 O 1700 32 0.59 O 1000 30 0.11 O 1400 33 0.23 A
2400 32 0.90 C 3300 30 0.87 A 2300 35 0.47 O 2800 35 0.58 O
500 12 0.48 C 2700 37 0.69 O 2200 28 0.38 O 4500 54 0.29 A
4900 50 0.29 A 550 11 0.41 C 1900 25 0.20 O
;
RUN;
/*指标筛选过程,结果选出credit_limit number_of_trades两变量*/
PROC STEPDISC DATA=build;
   CLASS target;
   VAR credit_limit number_of_trades utilization;
RUN;
/*判别分析过程*/
PROC DISCRIM DATA=build TESTDATA=build POOL=test OUT=disc;
   PRIORS prop;
   CLASS target;
   VAR credit_limit number_of_trades;
RUN;


2.logistic模型

 

PROC LOGISTIC DATA=build;
   MODEL target(ref='O') = credit_limit number_of_trades utilization
           / SELECTION=stepwise LINK=glogit;
RUN;
/*根据logistic过程得到的结果建立评估模型,-9.1618等参数来自proc logistic*/
DATA logit;
   SET build;
   phat_A=-9.1618+credit_limit*0.00116+number_of_trades*0.1263;
   phat_C=6.3220+credit_limit*(-0.00272)+number_of_trades*(-0.1629);
   prob_O = 1/(1+exp(phat_A)+exp(phat_C));
   prob_A = prob_O*exp(phat_A);
   prob_C = prob_O*exp(phat_C);
   max = max(prob_A, prob_C, prob_O);
   IF prob_O = max THEN pred = 'O';
   ELSE IF prob_A = max THEN pred = 'A';
   ELSE pred = 'C';
RUN;
/*结果一览*/
PROC FREQ DATA=logit;
   TABLES target * pred /LIST;
RUN;
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在SPSS进行多因素logistic回归分析的操作如下: 1. 打开SPSS软件,并导入你的数据集。 2. 菜单栏选择 "分析(Analyse)",然后选择 "回归(Regression)",再选择 "二分类逻辑回归(Binary Logistic)"。 3. 在弹出的对话框,将所有的自变量(多个因素)移动到 "因子(Factors)" 区域。你可以使用鼠标拖动或者使用右侧的箭头按钮来完成。 4. 在 "因子(Factors)" 区域,可以对每个自变量设置相应的选项,例如是否要进行交互作用、是否要进行心化等。点击每个自变量后面的 "设置(Options)" 按钮进行设置。 5. 在弹出的选项对话框,你可以选择是否要进行交互作用,设置交互作用的方法、是否要进行心化等。完成设置后点击确定。 6. 在回到 "二分类逻辑回归(Binary Logistic)" 对话框,选择 "因变量(Dependent)" 区域,将你的因变量移动到该区域。 7. 在 "因变量(Dependent)" 区域,你可以设置因变量的分类方法、是否要进行加权等。点击因变量后面的 "设置(Options)" 按钮进行设置。 8. 在弹出的选项对话框,你可以选择因变量的分类方法(例如默认的二分类、多分类等),设置分类方法的参照组、是否要进行加权等。完成设置后点击确定。 9. 在回到 "二分类逻辑回归(Binary Logistic)" 对话框,点击确定运行分析。 10. SPSS将会生成多因素logistic回归分析的结果报告,包括模型拟合程度、系数的显著性、预测准确度等。 以上是在SPSS进行多因素logistic回归分析的基本操作步骤,具体操作可能会因软件版本或个人需求有所不同。建议在使用前参考SPSS软件的帮助文档或教程,以便更好地理解和应用该方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值