SPSS Modeler C5.0学习笔记

本文详细介绍了如何使用IBM SPSS Modeler 18.0的C5.0节点构建决策树。通过数据源描述、分析思路、设计步骤,展示了从数据读取、预处理到模型构建的过程,旨在预测疾病患者的适用药物。重点讨论了字段类型设置、新字段导出、模型训练与评估,特别是C5.0算法的参数调整,如使用Boosting、修剪严重性和最小记录数等,以提高模型准确性和泛化能力。
摘要由CSDN通过智能技术生成
  • 学习资料

IBM SPSS Modeler 18.0 Applications 第8章

  • 数据源描述
    数据源名称:DRUG IN数据文件
    在这里插入图片描述

  • 应用模型

C5.0
C5.0 节点可以构建决策树或规则集。该模型的工作原理是根据在每个级别提供最大信息收获的字段拆分样本。目标字段必须为分类字段。允许进行多次多于两个子组的拆分。不支持交互式树创建

  • 分析思路

已收集了关于身患同一疾病的一组患者的数据。在治疗过程中,每位患者均对五种药物中的一种有明显反应,您通过数据挖掘找出适用于今后患有此疾病的患者的药物。

  • 设计步骤

1、选取源节点“var.file”,读取外部数据源;
选中从文件读取字段名称Read file names from files
数据选项卡,可以覆盖和更改某个字段的存储(这里的存储不同于测量)
类型选项卡,可以帮助解数据中的更多字段类型。还可以选择 读取值 来查看各个字段的实际值
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值