SPSS Modeler 数据整理之数据集成(指南 第三章)

本文介绍了在数据挖掘中如何使用SPSS Modeler进行数据集成,包括记录集成(追加行记录)和字段集成(追加列字段)。通过具体的案例和节点配置,展示了“追加”节点在记录集成中的应用,以及“合并”节点在字段集成中的使用,详述了各个选项卡的功能和操作步骤。
摘要由CSDN通过智能技术生成

在这里插入图片描述
我们在进行数据挖掘的过程中,往往需要从多个不同的数据源抽取数据,这时就需要对数据进行记录集成或字段集成,集成是指将不同数据源之间进行合并的过程。

1. 记录集成(给数据增加行)

记录集成:指给数据表格纵向追加行记录的过程。
采用的节点:“追加”节点
在这里插入图片描述
案例:Demos文件下“telco_Jan.sav”数据文件(1月份的电信客户名单,500条记录)与“telco_Feb.sav”数据文件(2月份的电信客户名单,500条记录)。
记录集成数据流:
在这里插入图片描述
追加节点包含3个选项卡:输入、追加、注解。
1.1 输入选项卡
在这里插入图片描述
1.2 追加选项卡
主要用于设定数据源的追加集

SPSS经典教材之一。本书主要针对SPSS 的中、高级用户,定位为应用统计专业的研究生教材和其他专业的统计分析参考书。它以SPSS 12.0 的功能为准,以统计理论为主线,详细介绍了SPSS 中的各种多变量统计模型和多元统计分析方法。在保持全书简明易懂风格的基础上,对统计理论作了详细的讲解。全书内容共分四大部分:第一部分讲解了一般线性模型和混合线性模型,并重点对前者中的方差分析模型进行了介绍;第二部分则在此基础上进一步介绍了回归模型,包括对连续因变量建模的线性回归模型、线性回归的衍生模型、通径分析模型和非线性回归模型,以及对分类因变量建模的Logistic 模型族和Probit 模型;第三部分系统介绍了因子分析、判别分析、对应分析、多维尺度分析等多元统计方法的原理及其在SPSS 中的实现;第四部分则对信度分析、生存分析、缺失值分析方法等较难归类,但又比较重要的统计分析方法进行了讲解。各章后均提供了参考文献和思考练习题,书后附录则以流程图的方式提纲草领地给出了统计方法的分类体系,便于读者理解。另外,为便于读者自行对比分析结果,书中大部分表为SPSS 自动生的。因此,大部分表及表题为英文。 需要指出的是,作为本套丛书的通用统计教材,本高级教程严格遵循了统计理论这一主线,在统计方法的纳入上是有所选择的。方法体系中比较特殊的时间序列模型并未纳入本书范畴,另有分册专门介绍;而对于联合分析、多维偏好分析、离散选择分析等在方法原理上并无特别之处,行业应用特点明显的模型,则将被放在相应的行业应用分册中讲解,本书不再专门介绍。除作为各专业研究生的统计教材和参考书外,本书还适用于各行业中希望深入学习和应用高级统计分析方法的读者。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值