SPSS Modeler数据挖掘学习_部分笔记

本文介绍了SPSS Modeler在数据挖掘中的应用,包括业务理解、数据准备、模型建立等步骤。讨论了数据挖掘任务如分类、回归、聚类和关联分析,以及变量类型在数据集成中的角色。重点讲述了数据清洗过程,如离群点和极端值的调整方法,并提供了使用Modeler进行数据清洗和模型构建的操作流程。
摘要由CSDN通过智能技术生成
数据挖掘是一个过程,是一个以数据为中心的循序渐进的螺旋式数据探索过程。
![上图指出,数据挖掘时一个以数据为核心多个环节紧密相连,循环反复且循序渐进的数据探索过程](https://img-blog.csdnimg.cn/20190404202741100.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAzMDU3Nw==,size_16,color_FFFFFF,t_70)

一、数据挖掘方法论的各环节:
1.业务理解
2.数据理解
一个简单数据理解流
3.数据准备
4.建立模型
5.方案评估
6.方案实施
二、数据挖掘的任务和应用:
1.数据总结
2.分类和回归
3.聚类分析
4.关联分析

三、数据挖掘得到的只是形式:
1.浓缩数据
2.树形图
3.规则
4.数学模型

四、数据挖掘算法的分类:
1.根据算法分析数据的方式划分
2.根据算法来自的学科划分
3.根据算法所得结果的类型划分
4.根据学习过程的类型划分

首先来了解一下Modeler的数据集成:
一、从数据挖掘角度看变量类型:
连续数值型:表示年龄、家庭人口数等。
二分类型,简称分类型:表示性别等。
多分类型,也称名义型:表示职业、籍

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值