- 学习资料
IBM SPSS Modeler 18.0 Applications 第6章
- 数据源描述
数据源名称telco.sav
- 应用模型
ADP自动数据准备
- 分析思路
ADP可以自动分析数据并识别需要修订的字段、筛选出有问题或者可能不可用的字段、在适当的时候派生出新的指标,本次实验将根据数据telco.sav,分别训练两个二项回归模型块,其中一个通过ADP对输入数据进行处理,另一个不对输入数据进行任何处理,由此对比分析ADP数据处理的作用。
- 设计步骤
1、选取源节点“Statistics文件”,读取外部数据源;
Variable names选择Read names and labels
Values选择Read data and labels
2、将一个类型节点附加到源节点, 将churn 字段的Measure测量级别设置为flag标志,并将角色设置为Target目标。将所有其他字段的角色设置为 Input,
3、将 Logistic 节点附加到“类型”节点。在 Logistic 节点上,单击“模型”选项卡并选择二项过程。在模型名称字段中,选择自定义并输入 No ADP - churn,
4、将ADP节点附加到类型节点后,在目标选项卡上保持默认设置,即以均衡的速度与准确性的方式分析与准备数据(还可以选择优先关注处理速度/优先关注准确性),在窗口顶部点击分析数据启动
5、分析ADP节点处理数据的结果,数据处理的结果将显示在“分析”选项卡上,字段处理摘要显示,在 41 项导人 ADP 节点的数据特征中,19项已转换为辅助处理,而有 3 个因未使用而废弃
6、将 Logistic 节点附加到ACP节点后面。在 Logistic 节点上,单击“模型”选项卡并选择二项过程。在模型名称字段中,选择自定义并输入 After ADP - churn
7、分别运行并比较两个模型的准确性(第一个没有经过ACP处理,第二个经过了ACP处理),通过分析节点分析显示:
经过ACP处理输入数据的模型正确率为78.8%
没有ACP处理输入数据的模型正确率为10.6%