SAS数据挖掘实战篇【七】

最新推荐文章于 2022-06-13 08:15:00 发布

weixin_30362801

最新推荐文章于 2022-06-13 08:15:00 发布

阅读量164

点赞数

原文链接：http://www.cnblogs.com/amengduo/p/9587563.html

版权

SAS数据挖掘实战篇【七】

6.5 SAS EM 数据挖掘-----预测模型

１问题定义

目标：建立模型预测贷款申请的信用状态，选择最优的模型来预测和减少损失。

数据集：SAMPSIO.DMAGECR

数据集大小：1000

变量数目：21（20个输入变量，1个目标变量）

变量描述

该损失矩阵将产生和第一个损失矩阵相似的决策，但是第二个矩阵产生的统计描述更加容易理解。

先验概率

在训练数据集中，

未预测数据：SAMPSIO.DMAGESCR

数据集大小：75（没有GOOD_BAD变量）

2 创建数据挖掘工程

4 设置目标变量

选择变量选项卡，右击GOOD_BAD的模型角色，设置变量角色为target。

5 为GOOD_BAD变量定义目标Profile

目标资料主要定义三种信息

（1）分类变量的目标级别

（2）决策矩阵

（3）先验概率

在变量选项卡中右击GOOD_BAD目标变量，编辑目标信息

设置目标事件级别

为GOOD_BAD变量定义决策矩阵

选择评估信息选项卡，显示四个预定义的矩阵

6 查看区间变量和类别变量的统计信息

可以发现没有缺失值，但是AMOUT变量倾斜度过高

创建顺序分组变量

选择目标关联选项卡，设置变量选择方法为卡方。

运行节点，查看结果。

在21个变量中，9个是rejected，包括分组变量AGE_GA2Y，将其设置为input

10 创建逐步回归逻辑模型

12 评估模型

运行评估节点，查看模型比较。从工具菜单中选择提升图。

13 定义评分数据集

打开score节点，选择如下

15 查看期望损失

在program选项卡中输入下面的代码，显示信用好的贷款申请者

options nocenter nodate;

data goodapps;

set &_SCORE;

if D_GOOD_BAD_ = 'accept';

run;

proc print data = goodapps lable;

var custid D_GOOD_BAD_ EL_GOOD_BAD_;

title "Good Credit Risk Applicants";

run;

http://www.cda.cn/view/17224.html
17 创建报告

查看创建的报表，在浏览器中查看。

18 关闭工程，完成项目。

转载于:https://www.cnblogs.com/amengduo/p/9587563.html

weixin_30362801

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
SAS数据挖掘实战篇【七】

SAS数据挖掘实战篇【七】6.5 SASEM数据挖掘-----预测模型１问题定义目标：建立模型预测贷款申请的信用状态，选择最优的模型来预测和减少损失。数据集：SAMPSIO.DMAGECR数据集大小：1000变量数目：21（20个输入变量，1个目标变量）变量描述该损失矩阵将产生和第一个损失矩阵相似的决策，但是第二个矩阵产生的统计描述更加容易...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。