SPSS Modeler ADP自动数据准备学习笔记

本文介绍了IBM SPSS Modeler 18.0中的ADP(Automatic Data Preparation)功能,通过实例展示了如何使用ADP自动处理数据,包括设置目标、分析数据、调整参数等步骤。ADP能自动识别和处理问题字段,提高模型准确性。通过对比实验,ADP处理后的模型正确率显著高于未处理的模型,验证了其在数据准备中的作用。
摘要由CSDN通过智能技术生成
  • 学习资料

IBM SPSS Modeler 18.0 Applications 第6章

  • 数据源描述

数据源名称telco.sav
在这里插入图片描述

  • 应用模型

ADP自动数据准备

  • 分析思路

ADP可以自动分析数据并识别需要修订的字段、筛选出有问题或者可能不可用的字段、在适当的时候派生出新的指标,本次实验将根据数据telco.sav,分别训练两个二项回归模型块,其中一个通过ADP对输入数据进行处理,另一个不对输入数据进行任何处理,由此对比分析ADP数据处理的作用。

  • 设计步骤

1、选取源节点“Statistics文件”,读取外部数据源;
Variable names选择Read names and labels
Values选择Read data and labels

2、将一个类型节点附加到源节点, 将churn 字段的Measure测量级别设置为flag标志,并将角色设置为Target目标。将所有其他字段的角色设置为 Input,
在这里插入图片描述
3、将 Logistic 节点附加到“类型”节点。在 Logistic 节点上,单击“模型”选项卡并选择二项过程。在模型名称字段中,选择自定义并输入 No ADP - churn,
在这里插入图片描述
4、将ADP节点附加到类型节点后,在目标选项卡上保持默认设置,即以均衡的速度与准确性的方式分析与准备数据(还可以选择优先关注处理速度/优先关注准确性),在窗口顶部点击分析数据启动
在这里插入图片描述
5、分析ADP节点处理数据的结果,数据处理的结果将显示在“分析”选项卡上,字段处理摘要显示,在 41 项导人 ADP 节点的数据特征中,19项已转换为辅助处理,而有 3 个因未使用而废弃
在这里插入图片描述
6、将 Logistic 节点附加到ACP节点后面。在 Logistic 节点上,单击“模型”选项卡并选择二项过程。在模型名称字段中,选择自定义并输入 After ADP - churn
在这里插入图片描述
7、分别运行并比较两个模型的准确性(第一个没有经过ACP处理,第二个经过了ACP处理),通过分析节点分析显示:
经过ACP处理输入数据的模型正确率为78.8%
没有ACP处理输入数据的模型正确率为10.6%

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值