spss+modeler+mysql_SPSS Modeler+Weka数据挖掘从入门到实战

该篇博客详细介绍了数据挖掘的基础知识,包括SPSS Modeler和Weka的软件操作,数据挖掘方法论CRISP-DM和SEMMA,以及数据库中的知识挖掘步骤。通过案例分析,展示了如何运用这两个工具进行客户信用风险评分模型的构建,同时探讨了描述性统计、可视化技术和KNN算法的应用,并提供了使用Weka进行KNN预测的实践操作。
摘要由CSDN通过智能技术生成

第1 篇 理论篇

第1 章 数据挖掘简介 ................................................................................... 1

1.1 数据挖掘的起源、定义及目标 ....................................................................................... 2

1.2 数据挖掘的发展历程 ....................................................................................................... 2

1.3 SPSS Modeler 和Weka 基础操作 .................................................................................... 4

1.3.1 SPSS Modeler 软件简介 ....................................................................................... 4

1.3.2 建立一个SPSS Modeler 项目 .............................................................................. 5

1.3.3 Weka 软件环境简介 ............................................................................................. 8

1.3.4 Weka 简单操作实例 ............................................................................................. 9

第2 章 数据挖掘方法论 .............................................................................. 15

2.1 数据挖掘方法论 ............................................................................................................. 16

2.1.1 CRISP-DM .......................................................................................................... 16

2.1.2 SEMMA .............................................................................................................. 16

2.2 数据库中的知识挖掘步骤 ............................................................................................. 17

2.2.1 字段选择 ............................................................................................................. 17

2.2.2 数据清洗 ............................................................................................................. 18

2.2.3 字段扩充 ............................................................................................................. 18

2.2.4 数据编码 ............................................................................................................. 19

2.2.5 数据挖掘 ............................................................................................................. 20

2.2.6 结果呈现 ............................................................................................................. 21

2.3 案例:运用SPSS Modeler 和Weka 做客户的信用风险评分模型 ............................. 22

2.3.1 案例说明 ............................................................................................................. 22

2.3.2 案例实操 ............................................................................................................. 23

2.3.3 运用SPSS Modeler 进行初步的数据挖掘 ........................................................ 28

2.3.4 运用Weka 进行数据汇入 .................................................................................. 34

2.3.5 Weka 自有数据存储格式arff 简介 ................................................................... 36

第3 章 基本的数据挖掘技术 ...................................................................... 38

3.1 描述性统计 ..................................................................................................................... 39

3.1.1 案例:通过数据判断客户是否需要新增电话线路 ......................................... 39

3.1.2 案例:运用描述性统计分析杂志社的客户特征 ............................................. 40

3.2 可视化技术 ..................................................................................................................... 42

3.3 KNN 原理及实例 ........................................................................................................... 44

3.3.1 KNN(K 最近邻)算法 ..................................................................................... 44

3.3.2 使用KNN 算法计算距离 .................................................................................. 45

3.3.3 案例:使用KNN 算法向用户推荐电影 ........................................................... 49

3.4 案例:运用Weka 的KNN 算法对诊断结果进行预测 ..................................................... 52

3.4.1 案例说明 ............................................................................................................. 52

3.4.2 运用Weka 中的IBk 模型进行预测 .................................................................. 53

3.5 案例:运用SPSS Mo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值